Anthropic Mythos: DI modelis, kuris randa spragas visuose naršyklėse — ir kodėl tai gąsdina saugumo ekspertus
·

Anthropic sukūrė DI modelį, kuris randa pažeidžiamumą kiekviename populiariame naršyklėje ir operacinėje sistemoje. Ir nusprendė jo nepaleisti viešai. Claude Mythos Preview — tai ko galbūt viešai nematysite, bet ko pasekmės jau jaučiamos kibernetinio saugumo sektoriuje.
Kas yra Claude Mythos Preview
Balandžio 7 d. Anthropic paskelbė apie Claude Mythos Preview — naujos kartos DI modelį, kuris pasiekė tokį pajėgumą kibernetinio saugumo srityje, kad kompanija nusprendė jo neišleisti plačiajai auditorijai. Tai pirmasis žinomas atvejis, kai didžioji DI laboratorija savanoriškai sulaiko modelį dėl per didelio pajėgumo.
Kas konkretaus? Mythos Preview jau rado tūkstančius aukšto lygio pažeidžiamumų — visuose populiariuose naršyklėse ir operacinėse sistemose. Modelis gali identifikuoti ir išnaudoti zero-day spragas ten, kur paprasti įrankiai jas praleistų.
Kodėl tai sukėlė „isteriją” saugumo sektoriuje
CNBC gegužės 8 d. straipsnis pavadino reakciją „isterija”. Ir iš dalies buvo teisus — ir iš dalies ne.
Problema yra dvejopo naudojimo prigimtis. Mythos gali:
- Rasti kritines spragas prieš tai, kai jas randa kiti — ir padėti jas uždaryti
- Tą patį padaryti blogų ketinimų atveju, jei patektų į netinkamas rankas
Skirtumas tarp gynybinio ir puoliminio naudojimo — ne kode, o ketinimuose. Tai ir yra problema. DI modelis negali žinoti, kurią pusę remia naudotojas.
Project Glasswing: kaip Anthropic kontroliuoja prieigą
Vietoj viešo paleidimo Anthropic pasirinko kitą kelią — Project Glasswing. Tai iniciatyva, kuria Mythos Preview prieinamas ribotam organizacijų ratui gynybiniam darbui.
Šiuo metu prieigą turi daugiau nei 40 organizacijų, kurios kuria arba prižiūri kritinę programinę infrastruktūrą. Jos naudoja Mythos kaip gynybinį įrankį — kad surastų spragas pirmiau, nei jas ras kas nors kitas.
Tai logiškas sprendimas, bet jis kelia ir klausimų: kas nusprendžia, kurios 40 organizacijų gauna prieigą? Ir ką daryti likusiems?
Reakcija: OpenAI atsakė su Daybreak Initiative
Anthropic ne vienas šioje erdvėje. OpenAI atsakė su Daybreak Initiative — sava kibernetinio saugumo programa, kuri tiesiogiai reaguoja į Mythos sukeltą diskusiją.
Microsoft taip pat nebuvo vangus — kompanija pranešė, kad daugiasluoksnis DI agentų sistema pralenkė Mythos kibernetinio saugumo etalonuose. Tai rinkos atsakas: kai vienas žaidėjas pakelia kartelį, kiti greitai seka.
Kontekstas svarbus — Anthropic šiuo metu siekia $900 mlrd vertinimo, o jų $200 mlrd sandoris su Google rodo, kad investicijos į saugumo tyrimus nėra tik PR.
Ką tai reiškia kibernetiniam saugumui 2026
Keičiasi pati grėsmių struktūra. Anksčiau zero-day spragų radimas reikalavo specializuotų žinių ir laiko. Dabar DI modelis tai gali padaryti greičiau ir mastelyje, kurio žmogus negali pasiekti.
Tai reiškia keletą dalykų praktiškai:
- Gynybiniai DI įrankiai taps privalomi, o ne pasirenkama opcija
- Kibernetinio saugumo rinka keisis — ne žmonės ieško spragų, o DI joms ieškoti samdomas
- Reguliavimas kol kas atsilieka — ES DI Aktas dar neaprėpia šios srities pilnai
Anthropic pozicija: savanoriškas suvaržymas
Įdomiausia dalis — ne pats modelis, o kompanijos sprendimas jį sulaikyti. Tai precedentas. Anthropic tiesiogiai pasakė: mes turime kažką, ko nenorime paleisti, nes tai per daug galinga be tinkamos kontrolės.
Tuo pačiu Anthropic Head of Policy Jack Clark viešai paskelbė, kad yra 60% tikimybė, kad DI sistemos pradės rekursyviai tobulėti pačios iki 2028 m. Tai ne spekuliacija — tai vidinis vertinimas iš žmonių, kurie kuria tuos modelius.
Ką daryti tu
Jei vadovaujate verslui ar dirbate IT srityje:
- Sekite Project Glasswing narių sąrašą — jei patenkate į kritinę infrastruktūrą, verta domėtis prieigos galimybėmis
- Peržiūrėkite saugumo auditų grafikus — DI pagreitina spragų atradimą, vadinasi ir jūsų sistemų rizika išauga greičiau
- Stebėkite reguliavimo pokyčius — rinkos pertvarkymas vyksta greitai
Išvada
Claude Mythos Preview yra signalo, o ne aliarmo laikas. Anthropic padarė teisingą sprendimą sulaikydami modelį ir sukurdami kontroliuojamą prieigos sistemą. Bet tai yra tik pirmas žingsnis — nes kita laboratorija gali nuspręsti kitaip. O tada klausimas nebus, ar tokios galimybės egzistuoja, o kas jas kontroliuoja.


