Kaip DI mokosi iš duomenų: mašininis mokymasis paprastai paaiškinta
·

Tau prireikė šią savaitę kažko naujo. Parašei žinutę ChatGPT arba Claude. Gavai atsakymą. Ir galbūt pirmą sekundę pagalvojai – na ir kaip jis tai žino?
Čia prasideda viena smalsiausių istorijų technologijų pasaulyje.
Trumpai: DI modeliai nemoka ničnieko iš gimimo. Jie mokosi. Kaip vaikas. Tik daug greičiau ir iš nesuprantamai daugiau pavyzdžių.
Tradicinė programa vs DI: kuo jie skiriasi iš esmės?
Tradicinė programa – tai tarsi receptas. Programuotojas surašo žingsnius: „jei a, tada b; jei c, tada d”. Viskas tiksliai numatyta. Sistema negali nieko daryti, ko į ją neįdėjai. Nei vieno žingsnio daugiau.
DI su mašininiu mokymusi – visai kas kita. Vietoj taisyklių – pavyzdžiai. Tūkstančiai, milijonai, kartais šimtai milijardų pavyzdžių.
Štai konkretus pavyzdys. Kaip sukurti spam filtrą?
Tradiciniu keliu: reikia parašyti taisykles. „Jei žodyje ‘laimėjai’, ‘nemokamas’, ‘prizas’ – tai spam.” Bet kas, jei spameriai parašo ‘l-a-i-m-ė-j-a-i’ su brūkšneliais, arba naudoja naują žodyną? Sistema nepasiruošusi. Ji žino tik tai, ką programuotojas numatė prieš metus.
Mašininio mokymosi keliu: paduodi sistemai 100 000 spam laiškų ir 100 000 normalių laiškų. Ji pati suranda modelius – kokie žodžiai, sakinių struktūros, siuntėjo elgesys signalizuoja spam. Tu nenurodei nė vienos taisyklės. Sistema surado jas pati.
Ir ji prisitaiko. Kai spameriai keičia taktiką, sistema pamato naujus pavyzdžius ir koreguoja savo supratimą. Nereikia programuotojo, kuris atnaujintų taisyklių sąrašą.
Tai esminis skirtumas: tradicinė programa vykdo taisykles, DI – atranda jas.
Kaip DI iš tikrūjų mokosi viduje?
Čia prasideda dalis, dėl kurios daugelis galvoja, kad tai kažkokia magija. Bet yra viena nesudėtinga idėja po visu tuo.
Įsivaizduok, kad moki vaiką atpažinti katę. Rodi nuotrauką: „tai katė.” Rodi kitą: „tai ne katė, tai šuo.” Po šimto nuotraukų vaikas išmoko kažką apie kates – forma, elgesys, bruožai. Po tūkstančio – jau atpažins net neaiškioje nuotraukoje.
DI tą patį daro su skaičiais. Kiekvienas paveikslėlis – tai tūkstančiai skaičių (pikseliai). Sistema bando spėti: „katė ar ne?” Jei klysta – koreguoja save. Klaida tampa pamoka. Tas klaidos-ir-korekcijos procesas kartojamas milijardus kartų. Ir kažkuriame taške sistema pradeda atpažinti kates geriau nei daugelis žmonių.
Yra trys pagrindiniai mokymosi tipai, apie kuriuos verta žinoti:
Mokymasis su mokytoju – duodi sistemai pavyzdžius su teisingais atsakymais (spam / ne spam; katė / šuo; ligon / sveikas). Labiausiai paplitęs tipas komercinėse programose.
Mokymasis be mokytojo – duodi daug duomenų be etikečių, sistema pati atranda grupes ir modelius. Naudinga, kai pats nežinai, ko ieškoti. Marketingo segmentavimas, anomalijų aptikimas.
Mokymasis per patirtį (reinforcement learning) – sistema bando veikti, gauna atlygį ar baudą, ir mokosi elgtis geriau. Taip buvo išmokyti DI modeliai žaisti šachmatais, Go – ir taip treniruojami šiuolaikiniai pokalbio DI.
ChatGPT, Claude ir kiti šiuolaikiniai modeliai naudoja visus tris. Ir dar papildomą žmogaus grįžtamojo ryšio etapą, kuris leidžia jiems elgtis natūraliau.
Kur mašininį mokymąsi naudoji kiekvieną dieną?
Pamąstyk apie savo eilinę dieną.
Rytas. Telefono atpažinimas veidu – mašininis mokymasis. Spotify rekomenduoja dainą pagal tai, ką klausei vakar – mašininis mokymasis. Google Translate išverčia straipsnį – mašininis mokymasis.
Diena. Banko sistema blokuoja įtartiną mokėjimą prieš tau paskambinant – mašininis mokymasis. Instagram nusprendžia, kurios nuotraukos rodomos tavo feed’e – mašininis mokymasis. Gmail nukelia laišką į spam – mašininis mokymasis.
Vakaras. Netflix siūlo serialą, kurį tikrai pažiūrėsi – mašininis mokymasis. Navigacijos programa pasirenka kelią įvertinusi realaus laiko spūstis – irgi mašininis mokymasis.
Skaičiai sako, kad paprastas žmogus su smartphone’u kasdien sąveikauja su mašininio mokymosi sistemomis apie 70-100 kartų. Tiesiog jos veikia nepastebimai.
Ir štai ką tai reiškia tau praktiškai: kaskart, kai kažkuri programa tampa geresnė su laiku be akivaizdžių atnaujinimų – ten veikia mašininis mokymasis. Tavo naudojimosi duomenys tampa jos pamoka.
Tai kelia svarbų klausimą apie privatumą ir DI įrankius – nes sistema mokosi iš tavo duomenų. O jei domina, kur visa ši mokymosi galia veda ilgalaikėje perspektyvoje – DeepMind vadovas prognozuoja bendrąjį DI iki 2029 metų.
Tuo tarpu praktiniam naudojimui – kaip rašyti DI prompts, kad gautum geresnius atsakymus. Nes žinoti, kaip DI mokosi, tiesiogiai padeda suprasti, kodėl kai kurie klausimai duoda geresnius rezultatus.
Papildomas skaitinys anglų kalba: IBM – kas yra mašininis mokymasis (techninis paaiškinimas).
Supratimas, kaip DI mokosi, nekeičia to, kaip jį naudoji šiandien. Bet keičia tai, kaip galvoji apie jo galimybes ir ribas. O tai yra daug vertingiau nei tik mokėti parašyti prompt’ą.


