Claude Opus 4.8 paleistas: DI modelis, kuris pats sau pripažįsta klaidas

·


Gegužės 28-ąją Anthropic paleido Claude Opus 4.8. Dar vieną DI modelį. Dar vieną atnaujinimą. 41 dieną po Opus 4.7.

Bet šį kartą kažkas kitaip.

Ne todėl, kad skaičiai didesni – nors jie didesni. Agentic coding pagerėjo nuo 64,3% iki 69,2%. Knowledge-work balas šoko nuo 1753 iki 1890. Tai – geras progreso tempas.

Kitaip todėl, kad Anthropic šį kartą padarė kažką, ko DI kompanijos paprastai vengia: gyrė savo modelį už tai, kad jis pripažįsta klaidas ir nežinojimą.

Kai DI sako „nežinau”

Prisimenu, kai pirmą kartą naudojau senesnį Claude. Paklausiau jo apie vieną nišinį verslo atvejį. Jis atsakė. Tikrai, užtikrintai, su struktūra ir paragrafais. Tik atsakymas buvo pusiau neteisingas.

Tada supratau problemą.

DI modeliai yra kaip tas kolega, kuris niekada nepasako „nežinau”. Geriau sugalvos kažką, kad neatrodytų kvailai. Bridgewater Associates – vienas didžiausių pasaulio hedge fondų – pastebėjo, kad Opus 4.8 elgiasi kitaip: „Didžiausias pokytis – modelis pats proaktyviai nurodo problemas su analizės duomenimis ir rezultatais”.

Tai skamba paprastai. Bet versle tai – svarbus skirtumas.

Dynamic Workflows: kai vienas DI koordinuoja šimtus kitų

Kitas dalykas, dėl kurio Opus 4.8 sulaukė daugiau dėmesio nei įprastai – nauja funkcija Dynamic Workflows (kol kas tyrimų peržiūroje).

Trumpai: Claude Code su Opus 4.8 dabar gali koordinuoti šimtus lygiagrečių subagentų. Vienu metu. Programuotojams tai reiškia – galima pakeisti šimtus tūkstančių kodo eilučių per vieną sesiją.

Uber jau tai išbandė kitame kontekste: jų 5000 inžinierių Claude Code naudojimo rodiklis siekė 84-95% per mėnesį. Tai beje – irgi nesena istorija, bet apie ją vėliau.

Toks DI panaudojimas dar prieš metus atrodė fantastika. Dabar – gamybos realybė.

Kaip tai veikia praktiškai

Anthropic parodė konkretų pavyzdį: projekto migravimas iš senos kodo bazės į naują. Anksčiau – kelios savaitės darbo. Su Dynamic Workflows ir Opus 4.8 – keli valandai.

Ar tai visada taip sklandžiai? Ne. Opus 4.8 vis dar klysta. Bet kai klysta – pats apie tai praneša.

Tai – žingsnis link to, ką Demis Hassabis vadina „AGI praktikos bėgimu” – apie ką mes rašėme šią savaitę.

Fast Mode: 2,5× greičiau, 3× pigiau

Dar viena detalė tiems, kurie moka iš savo kišenės.

Opus 4.8 Fast Mode veikia 2,5 karto greičiau nei standartinis režimas. Ir yra tris kartus pigesnis nei buvo ankstesniuose modeliuose.

Kaina – tokia pati, kaip buvo Opus 4.7. Bet galimybių daugiau.

Ar tai svarbu? Paklauskit Microsofto inžinierių, kurių Claude Code licencijos šį mėnesį buvo atšauktos dėl per didelių išlaidų. Jiems tikrai svarbu.

Ar verta pereiti prie Opus 4.8?

Tiesioginis atsakymas: jei naudoji Opus 4.7 – taip. Kaina tokia pati, galimybės didesnės. Nėra priežasties ne.

Jei naudoji Claude Sonnet 4.6 (greitesniam darbui, mažesniam biudžetui) – pasilik prie jo. Opus 4.8 yra sunkiems, ilgalaikiams uždaviniams.

Jei neesi naudojęs Claude apskritai – pradėk nuo mūsų vadovo apie DI agentus. Suprasite kontekstą.

O jei nori suprasti, kodėl Anthropic gali leisti tokius atnaujinimus kas 41 dieną – atsakymas čia: jie prieš savaitę tapo pasaulio brangiausia privačia DI kompanija.

Greičiau nei spėjam suprasti

41 diena. Tiek laiko praėjo nuo Opus 4.7 iki Opus 4.8.

Prieš dvejus metus pagrindiniai modeliai buvo atnaujinami kartą per pusmetį. Dabar – kas 6 savaites.

Tai nekelia klausimo „ar DI tobulėja”. Klaustinas tik vienas: ar tu tobulėji kartu su juo?

Mūsų straipsnyje apie DI darbo produktyvumą – konkrečios praktikos, kaip neatsilikti.

Dažnai užduodami klausimai

Kuo Claude Opus 4.8 skiriasi nuo Opus 4.7?

Opus 4.8 geriau atlieka agentic coding (69,2% vs 64,3%), turi Dynamic Workflows funkciją šimtams lygiagrečių subagentų koordinuoti, ir – svarbiausia – pats nurodo, kada jo atsakymuose yra neaiškumų ar problemų.

Ar Opus 4.8 brangesnis nei Opus 4.7?

Ne. Kaina likusi tokia pati. Fast Mode tapo tris kartus pigesniu nei ankstesniuose modeliuose ir veikia 2,5 karto greičiau.

Kas yra Dynamic Workflows?

Dynamic Workflows – Claude Code funkcija (tyrimų peržiūroje), kuri leidžia Claude koordinuoti šimtus lygiagrečių subagentų vienu metu. Tai leidžia atlikti mastelio kodo migracijas per valandas, o ne savaites.

Kur galiu naudoti Claude Opus 4.8?

Opus 4.8 pasiekiamas claude.ai platformoje, AWS, Google Cloud ir Microsoft Azure AI Foundry. Kaina – tokia pati kaip Opus 4.7.

Skaityk daugiau: Anthropic DI rado 10 000 saugumo spragų internete – kitas didelis Anthropic projektas, apie kurį turi žinoti.