,

Anthropic Claude agentai dabar „svajoja”. Tarp užduočių išmoksta iš savo klaidų patys, be žmogaus pagalbos

·


Anthropic vakar San Franciske surengė savo pirmąją didelę kūrėjų konferenciją „Code with Claude”. Kai kas apie tai jau yra rašę. Bet niekas dar nepasakė svarbiausio dalyko.

Anthropic išmokė savo agentus svajoti.

Nuoširdžiai. Tai oficialus funkcijos pavadinimas. Dreams. Ir tai gali būti vienas svarbiausių praeitų metų pranešimų DI agentų pasaulyje.

Anthropic Claude Dreams agentai

Kas yra Dreams ir kodėl tai svarbu

Iki šiol DI agentai veikė taip. Tu duodi užduotį, agentas ją atlieka, baigia darbą, viskas pamiršta. Kitą kartą pradedi nuo nulio. Net jei agentas tą pačią klaidą padarė dešimt kartų iš eilės, vienuoliktą kartą jis greičiausiai padarys ją vėl.

Dreams keičia šį žaidimą. Tai foninis procesas, kuris veikia tarp užduočių. Praktiškai agentas „pasvajoja” naktį arba per pertrauką. Per tą metą jis peržiūri savo praeities sesijas. Ieško pasikartojančių klaidų. Pastebi, kuriose situacijose veikė gerai. Atnaujina savo atminties bazę.

Anthropic tai paaiškina paprastai. „Atmintis ir svajojimas kartu suformuoja patikimą atminties sistemą agentams, kurie tobulina save patys.”

Skirtingai nuo žmonių, agentas neturi miego. Bet jam reikia laiko apdoroti tai, ką jis nuveikė. Štai kodėl pavadinimas tinka.

Kitos dvi naujos funkcijos

Konferencijoje pristatytos ne viena, o trys svarbios funkcijos:

Outcomes (vieša beta versija). Tu surašai kriterijus, ką laikai geru rezultatu. Atskiras vertintojas (kitas DI) tikrina, ar agento darbas atitinka tavo kriterijus. Jei ne, tas vertintojas nurodo, ką taisyti, ir agentas bando dar kartą. Anthropic skelbia, kad tai pagerina sėkmės rodiklį iki 10 procentinių punktų lyginant su tradicinio prompto naudojimu.

Multi-agent Orchestration (vieša beta versija). Vienas agentas vadovas suskaido sudėtingą užduotį į mažesnes dalis ir paskirsto jas po-agentams. Galima sekti, ką kiekvienas po-agentas veikia, per Claude Console. Anksčiau apie agentinio DI principus rašėme atskirame vadove. Dabar tai jau veikia masiškai.

Visos trys funkcijos kartu paima vieną stiprų principą. Agentas nebėra vienkartinis darbas. Tai sistema, kuri auga laike.

Pro ir Max vartotojams – laiko ribos padvigubėjo

Tai bonus pranešimas, kuris pradžiugins kasdienius vartotojus. Anthropic padvigubino naudojimo ribas Pro ir Max abonementams. Buvo 5 valandos. Dabar 10 valandų.

Šis sprendimas tiesiogiai susijęs su vakarykšte SpaceX nuoma. Be papildomos infrastruktūros tokio padidinimo nebūtų buvę. Dabar Anthropic turi pakankamai pajėgumų, kad leistų vartotojams naudoti Claude beveik be pertraukos.

Ką tai reiškia praktiškai

Tarkime, tu naudoji DI agentą klientų aptarnavimui. Iki šiol kiekvienas naujas pokalbis prasidėdavo lyg agentas pirmą dieną darbe. Net jei vakar jis sutvarkė šimtą panašių užklausų, šiandien jam vis tiek reikia paaiškinti tas pačias taisykles.

Su Dreams situacija kitokia. Naktį agentas peržiūri vakarykštes sesijas. Pastebi, kad daugelis klientų klausia apie konkretų produktą. Pastebi, kad jo atsakymas X dažnai sulaukia teigiamo įvertinimo, o atsakymas Y – neigiamo. Ryte agentas pradeda darbą jau šiek tiek geresnis, nei buvo vakar.

Tas pats principas tinka programavimui, dokumentų rengimui, finansinių užklausų vykdymui. Bet kuri pasikartojanti užduotis dabar tampa savaime tobulėjanti.

Praktinės ribos

Dreams kol kas yra tyrimo peržiūros versijoje (research preview). Tai reiškia, kad tu gali naudoti, bet ne visi atvejai bus stabilūs. Anthropic siūlo dvi parinktis. Automatinis atminties atnaujinimas arba rankinė peržiūra.

Kaip ir su DI haliucinacijomis, čia svarbi ta pati pamoka. Pasitikėk, bet patikrink. Ypač pirmus mėnesius. Agentas gali iš klaidos „išmokti” netinkamą sprendimą, ir per kelis ciklus tai gali tapti rimta problema.

Multi-agent orchestracija kelia kitus klausimus. Kai sudėtingą užduotį atlieka penki ar daugiau agentų, atsiranda nauja problema – sekti, kas ką padarė. Anthropic šitam tikslui pateikia Claude Console su pilna istorija. Tačiau verslo aplinkoje tai reiškia, kad reikia dar vieno auditoriaus role.

Kontekstas. Anthropic žino, ko siekia

Tai ne pirmas Anthropic žingsnis link verslui orientuoto DI. Per pastarąsias savaites kompanija pristatė 10 finansų agentų. Sudarė sutartį su FIS dėl bankų aptarnavimo. Padidino infrastruktūrą trimis kartais.

Šie žingsniai turi vieną tikslą. Verslo klientams reikia ne tik chatbot’o. Jiems reikia agentų, kurie tobulėja, mokosi iš darbo ir veikia kaip komanda. Dreams, Outcomes ir Multi-agent Orchestration yra tos infrastruktūros pagrindas.

Kas toliau

Anthropic šios konferencijos serijos tęsinys vyks Londone (gegužės 19 d.) ir Tokijuje (birželio 10 d.). Tikėtina, kad bus pristatyti nauji integraciniai partneriai. Galbūt nauji modeliai. Bet kad ir kas atsitiktų vasarą, šios trys funkcijos jau pakeitė tai, kaip žmonės galvoja apie agentus.

Praeityje agentas buvo įrankis. Šiandien jis tampa darbuotoju, kuris auga su tavimi. Skirtumas atrodo subtilus, bet jis pakeičia visą požiūrį į automatizaciją. Daugiau laiko praleisi mokydamas agentą tinkamų sprendimų. Mažiau laiko praleisi pats spręsdamas tas pačias problemas iš naujo.