Kas yra „mąstančio režimo” DI ir kodėl jis taps standartas
·

Pernai vasarą OpenAI pristatė pirmąjį „o1″ modelį. Jis veikė kitaip nei ChatGPT. Klausimą gavęs jis ne iš karto rašė atsakymą. Pirma sustojo, „pagalvojo” 5–60 sekundžių, ir tik tada pateikė rezultatą. Dabar šis principas atėjo į visus didžiausius modelius. Pavadinimu „thinking mode” arba „reasoning”.

SYSTEM 1 PRIEŠ SYSTEM 2
Šitos sąvokos kilo iš psichologijos. Daniel Kahneman knygoje „Thinking, Fast and Slow” (2011) jas pavadino dviem žmogaus mąstymo režimais.
System 1 yra greitas, automatinis. Kai matai 2+2, atsakymas „4″ ateina iš karto, be sąmoningo skaičiavimo. Tai apima ir veido atpažinimą, refleksus, kalbinę intuiciją.
System 2 yra lėtas, sąmoningas. Kai sprendi 17 × 23 mintinai, tu turi „pagalvoti”. Reikalauja energijos, dėmesio, sąmoningo darbo. Tai apima loginį mąstymą, planavimą, sprendimų priėmimą.
KAIP TAI VEIKIA DI
Iki 2024 metų visi DI modeliai veikė kaip System 1. Tu rašai klausimą, modelis iš karto generuoja atsakymą. Jokio „mąstymo”. Jokio plano. Tiesiog rezultatas.
System 2 modeliai (OpenAI o1, GPT-5.5 Thinking, Claude Opus 4.7 Extended Thinking, Gemini 3.1 Deep Think) veikia kitaip. Jie turi vidinį „pamąstymo” žingsnį. Sukuria daug skirtingų sprendimo kelių, juos palygina, pasirenka geriausią. Tik tada generuoja matomą atsakymą.
Skirtumas dažnai esminis. Pavyzdžiui, sudėtingam matematikos uždaviniam. Klasikinis modelis duos atsakymą per 2 sekundes, dažnai klaidingą. Thinking modelis užtrunka 30 sekundžių, bet rezultatas dažniausiai teisingas.
KO TAI KAINUOJA
Dvi dalykai. Pirma, laikas. Thinking modeliai sukasi 5–60 sekundžių vietoj akimirkos. Reikia šito priimti.
Antra, pinigai. Inference kaštai šiems modeliams 5–10 kartų didesni. Dėl to OpenAI Pro planas (200 dolerių per mėnesį) leidžia neribotą Thinking režimo naudojimą, o Plus planas (20 dolerių) tik kelias užklausas per dieną.
KOKIOMS UŽDUOTIMS NAUDINGA
Thinking režimas verta jungti tik tada, kai užduotis to nusipelno. Pavyzdžiai.
Sudėtingi programavimo darbai. Kur reikia struktūrinio sprendimo, ne tik sintaksės.
Mokslo skaičiavimai. Kur klaidos kainuoja brangiai.
Strateginiai sprendimai. Kur reikia palyginti kelis variantus.
Teisinė ar finansinė analizė. Kur klaidos turi praktines pasekmes.
Paprastoms užduotims (rašymas, vertimai, paieškos) thinking režimas yra pertekliniai. Klasikinis modelis pakanka.
KAS ATEINA TOLIAU
Per artimiausius 12 mėnesių thinking režimas taps standartas. David Silver Ineffable Intelligence kuria DI, kuris mąsto dar ilgiau (valandas, ne sekundes). Apie superintelligence rašėme atskirai.
Galiausiai pasieksime tašką, kuriame DI mąstys kelias dienas vienai užduočiai (kaip žmogus mąsto apie karjerą). Tai yra agentinio DI ateitis. Šiandien tai dar tik pradžia.
Tu pats naudojai thinking režimą? Kuriai užduočiai jis tau pasitarnavo geriausiai? Parašyk komentaruose.


