OpenAI Codex įsibrovė į Chrome ir parsivedė skaitmeninius augintinius. Kodėl tai didesnis pokytis nei atrodo

Gegužės 8 dieną OpenAI tyliai paspaudė publikavimo mygtuką ir Codex komanda gavo dvi labai keistas dovanas. Pirma. Codex agentas dabar moka pats lakstyti po Chrome naršyklę. Antra. Greta tavo kodo redaktoriaus dabar gali sėdėti animuotas drakoniukas vardu Bocchi.

Skamba kvailai? Kaip tik dėl to verta prisėsti.

Codex Chrome: ne dar viena „computer use” demonstracija

Iki šiol DI agentai bandė valdyti tavo naršyklę per kažką, kas vadinasi „computer use”. Praktikoje tai reiškė, kad agentas perima tavo pelę, kursorius ima judėti pats, o tu sėdi ir žiūri kaip robotas užpildo formą per dvi minutes ten, kur tu būtum pabaigęs per dvidešimt sekundžių.

Codex Chrome plėtinys veikia kitaip. Jis naudoja tavo prisijungusią Chrome sesiją kaip kontekstą, bet užduotis vykdo fone, atskirose Chrome tab grupėse. Tu nebijai, kad pelė tavęs nepaliks ramybėje, ir tuo pačiu agentui suteiki priėjimą prie visko, kur jau esi prisijungęs. Dashboard’ų. Vidinių įrankių. Debug logų.

OpenAI praneša, kad plėtinys jau veikia macOS ir Windows visuose regionuose, išskyrus ES ir JK. Ten dar tvarko reguliaciją. Codex App lange dabar matysi naują „Use Chrome” mygtuką, kuris paleidžia užduotį prieš tavo gyvą sesiją.

Kam to reikia praktiškai

Pavyzdžiai, kuriuos OpenAI pateikia, atrodo gana proziški. Užpildyti dažnai pasikartojančius formularus. Patikrinti kelis dashboard’us paeiliui. Surinkti duomenis iš kelių vidinių įrankių į vieną santrauką. Atlikti debug per realią naršyklės sesiją, kur reikia būti prisijungus.

Bet jeigu pažiūri į tai per programuotojo akinius, čia gana didelis dalykas. Tai pirmas kartas, kai agentas gali dirbti tavo prisijungusioje sesijoje be to, kad tu turėtum atskirai konfigūruoti API raktus, OAuth scope’us ar VPN. Jis tiesiog pasiima tavo cookie ir eina dirbti.

Šitai keičia DI agento pasirinkimo logiką. Užduotys, kurioms anksčiau reikėjo Playwright skripto arba MCP serverio, dabar gali būti įvykdytos vos parašius natūralia kalba „eik į Linear, surask visus ticket’us su label X ir parašyk man jų santrauką”.

O dabar apie tuos augintinius

Įvedi į Codex App komandą /pet ir ekrano kampe atsiranda mažas animuotas padaras. Aštuoni numatytieji variantai. Bocchi, Pixel, Goblin ir dar pora keistesnių. Jei tau jų neužtenka, /hatch komanda paleidžia DI generatorių, kuris pagal tavo prompt’ą sukuria personalizuotą kompanioną.

Kam jie reikalingi? Niekam. Ir tuo pačiu visam kam.

Praktiškai augintiniai yra vizualus indikatorius, kas šiuo metu vyksta su tavo Codex užduotim. Vietoj to, kad žiūrėtum į progress bar’ą, žiūri į drakoniuką. Kuris arba snaudžia (užduotis baigta), arba laksto (vyksta darbas), arba mojuoja tau letena (reikia tavo input’o).

OpenAI net paskelbė, kad pirmiems dešimčiai vartotojų, kurie susikurs įdomiausius augintinius, duos 30 dienų ChatGPT Pro nemokamai. Tipiška San Francisco rinkodara, bet ji veikia. Per kelias dienas X jau pilnas screenshot’ų su keisčiausiomis kūrybėmis.

Kodėl ši kombinacija nėra atsitiktinė

OpenAI logika tokia. Jei tu paliksi agentą dirbti penkias minutes ir nieko nematysi, tu išsiblaškysi. Atidarysi YouTube. Pamiršti, kas vyksta. Tada agentas baigs darbą, parašys notification’ą, tu jos nepamatysi, ir visa „autonomijos” idėja sugriūva.

Augintinis yra mikro-prisijungimo įrankis. Jis sėdi tavo akiraty, juda, daro mažus garsus, ir tu psichologiškai liek pat pasilieki šalia užduoties. Tai tas pats principas, kuris veikia su Anthropic Claude agentų „svajojimu” tarp užduočių. Vizualizuoti procesą, kuris kitaip lieka nematomas.

Be to, žmonės prie augintinio prisiriša. O prie ko prisiriši, tą rečiau atsisakai. OpenAI rinkodaros departamentas tai gerai supranta.

Ką tai reiškia tau

Jeigu tu programuoji ar dirbi su DI įrankiais kasdien, Chrome plėtinys vertas išbandyti tą pačią dieną. Pirmiausia tam, kad pajustum skirtumą tarp „computer use” ir „extension use” architektūros. Tai nėra subtili detalė. Tai du visiškai skirtingi modeliai, kaip agentas integruojasi į tavo darbo tėkmę.

Augintinį gali ignoruoti. Bet pabandyk vieną dieną. Įdomu, kiek ilgai išlaikysi savo prisirišimą prie idėjos, kad tu rimtas profesionalas, kuris programuoja be jokių distrakcijų.

Codex Chrome plėtinys ir augintiniai jau veikia visiems Plus, Pro ir Business plano vartotojams. ES ir JK skaitytojams teks dar palaukti, kol Briuselio reguliatoriai išspręs, ar agentas, kuris pasiima tavo cookie, yra duomenų valdytojas.

Apie tai, kaip apskritai veikia šių agentų atmintis ir kodėl jie skiriasi nuo paprasto chat bot’o, jau rašėme atskirai. Jeigu nori suprasti, kuo skiriasi Codex Chrome plėtinys nuo to, ką gali Microsoft Office, palygink jį su Anthropic Claude integracija Microsoft Office. Skirtumai matosi iš pirmų klausimų.

O jei vis dar nesi tikras, kuris DI tau labiausiai tinka kasdienybei, žiūrėk mūsų ChatGPT, Claude ir Gemini palyginimą.