Anthropic paleido Claude Fable 5: kodavimo DI, kuris pralenkė GPT-5.5 ir keičia lenktynių taisykles

·


Birželio 9 dieną Anthropic padarė tai, ko iki šiol nebuvo daręs nė vienas DI kūrėjas. Jie paleido tą patį modelį kaip du atskirus produktus su skirtingomis taisyklėmis ir skirtingomis prieigos sąlygomis.

Claude Fable 5 yra viešoji versija. Prieinama kiekvienam. Claude Mythos 5 yra tas pats variklis, bet su pašalintais saugumo filtrais, ir prieinama tik atrinktiems mokslo bei saugumo sektoriaus partneriams.

Kodėl tai svarbu? Nes skaičiai, kuriuos Anthropic pateikė, yra tokie, kuriuos sunku ignoruoti, net jei esi skeptiškai nusiteikęs dėl DI hype ciklo.

Kodavimo testai: skirtumas, kurio negalima nuneigti

SWE-Bench Pro testas matuoja, kaip tiksliai DI sprendžia realias programinės įrangos klaidas iš tikrų projektų, ne specialiai sukonstruotų bandymams. Fable 5 pasiekė 80,3 proc. Claude Opus 4.8 surinko 69,2 proc. GPT-5.5 surinko 58,6 proc.

FrontierCode Diamond, skirtas pačioms sunkiausioms kodavimo užduotims, Fable 5 pasiekė 29,3 proc. Opus 4.8 pasiekė 13,4 proc. GPT-5.5 pasiekė 5,7 proc.

Ties sunkiausiomis užduotimis Fable 5 lenkia GPT-5.5 daugiau nei penkis kartus. Tai nėra rinkodarinė frazė. Tai yra skaičius.

Stripe, viena didžiausių tarptautinių mokėjimų platformų, viešai papasakojo šį atvejį: Fable 5 atliko pilną kodo migraciją 50 milijonų eilučių Ruby bazėje per vieną dieną. Ta pati užduotis žmonių komandoms būtų užtrukusi daugiau nei du mėnesius.

Viena diena prieš du mėnesius. Tai yra skaičius, nuo kurio sunku atsiplėšti.

Dvi to paties modelio versijos: precedentas, kurio dar nebuvo

Galbūt labiausiai intriguojanti šios istorijos dalis yra ne skaičiai, o pats sprendimas.

Anthropic pirmą kartą DI pramonėje nusprendė paleisti tą patį modelį dviem versijomis vienu metu. Fable 5 turi tris saugumo filtrus: kibernetiniam saugumui, biologiniams tyrimams ir modelio apsaugai nuo neteisėtų kopijų. Anthropic teigia, kad šie filtrai veikia mažiau nei 5 proc. visų sesijų. Tai reiškia, kad 95 proc. vartotojų niekada net nepamatys, kad filtras buvo taikomas.

Mythos 5 versija, prieinama tik atrinktiems partneriams, naudojama vaistų kūrimui, autonominiams genomikos tyrimams per 138 rūšių duomenis ir kibernetinių grėsmių analizei. Tai sritys, kur DI galimybės jau seniai peržengia tai, ką plačioji visuomenė mato kasdieniame naudojime.

Klausimas, kurį DI pramonė jau kelia: ar tai taps nauju standartu? Viešoji versija kiekvienam, specialistų versija tik tiems, kam patikima? Tai visiškai naujas principas, ir kiti kūrėjai stebės šį eksperimentą atidžiai.

Ko dar gali Fable 5, be kodavimo

Kodavimas yra labiausiai matomas pasiekimas, bet ne vienintelis.

Fable 5 ypač gerai veikia su vizualine informacija. Jis gali paimti mokslinių tyrimų grafikus ir tiksliai ištraukti iš jų skaičius ten, kur kiti modeliai skaito apytiksliai. Gali iš ekrano nuotraukos atstatyti veikiančio kodo struktūrą. Finansinėje analizėje ir teisinių dokumentų skaityme jis taip pat lenkia konkurentus lyginamuosiuose testuose.

Ilgo konteksto darbas, kai reikia vienu metu turėti galvoje milijonus teksto žetonų, yra vienas stipriausių Fable 5 privalumų. Tai svarbu ne tik programuotojams. Advokatai, finansų analitikai ir tyrėjai, kurių darbas reikalauja dirbti su dideliais dokumentų kiekiais, mato reikšmingą skirtumą.

Galiausiai, matematika ir moksliniuose tyrimuose Fable 5 taip pat rodo stiprius rezultatus. GPQA Diamond (aukšto lygio mokslo klausimai) ir MMMU-Pro (multimodaliniai profesinio lygio testai) jis lenkia visus ankstesnius Claude modelius ir didžiąją dalį konkurentų.

Kainos kalkuliacija ir ką tai reiškia praktiškai

10 dolerių už milijoną įvesties žetonų. 50 dolerių už milijoną išvesties žetonų.

Tai beveik dvigubai daugiau nei Opus 4.8. Bet perpus mažiau nei buvo Mythos Preview versija prieš tai. Praktinė kalkuliacija: jei Fable 5 atlieka dvigubą darbą per tą patį laiką, faktinė kaina per atliktos užduoties vienetą yra panaši arba mažesnė. Stripe istorija tai iliustruoja konkrečiai.

DI įrankių rinkoje pokyčiai dabar vyksta greičiau nei bet kada anksčiau. Dar prieš pusmetį Claude buvo laikomas „tuo kitu modeliu”. Dabar Claude rinkos dalis per metus išaugo 306 proc., ir Fable 5 yra tiesioginis šio augimo tęsinys.

Kodavimo karas prasidėjo rimtai

Fable 5 pasirodymas sukėlė reakcijų grandinę visoje DI pramonėje.

Google CEO Sundar Pichai viešai pripažino, kad kalbant apie agentinį kodavimą ir ilgo horizonto užduotis, Google šiuo metu „šiek tiek atsilieka”. Tai neįprastas komentaras iš žmogaus, vadovaujančio 2 trilijonų dolerių vertės kompanijai.

Microsoft per savo Build 2026 konferenciją birželio pradžioje pristatė MAI-Code-1, pirmąjį savarankišką kodavimo DI modelį. Faktas, kad ir Microsoft, ir Google skubiai kuria savo kodavimo modelius, yra tiesioginis atsakas į Anthropic Claude Code sėkmę.

DI kodavimo rinka per paskutinius 12 mėnesių tapo vienu karšiausių technologijų sektoriaus kovos laukų. Jei dar nesi apsisprendęs, kurį DI įrankį naudoti savo darbui, šis vadovas apie 7 klausimus prieš renkantis DI įrankį gali padėti suprasti, ką šie skaičiai tau reiškia asmeniškai.

Pilnas Anthropic pranešimas su visais lyginamaisiais testais ir techninėmis detalėmis prieinamas oficialiai jų naujienų puslapyje.

DI lenktynės 2026 metais tapo tokios greitos, kad informacija, kuri buvo aktuali prieš tris mėnesius, jau gali būti pasenusi. Claude Fable 5 yra dar vienas to pavyzdys. Ir šį kartą skaičiai kalba aiškiau nei paprastai.