,

Balandžio DI modelių maratonas: kas ką išleido ir kodėl tau turėtų rūpėti

·


Balandis dar nesibaigė, o jau galima rašyti knygą apie tai, kiek naujų DI modelių pasirodė. Tokio tempo nebuvo nei 2024-aisiais, nei 2025-aisiais. Kiekviena savaitė atnešė kažką naujo. Ir ne šiaip atnaujinimą, o rimtus produktus.

Pažiūrėkim kas nutiko vien per pastarąsias kelias dienas ir visą balandį.

GPT-5.5: OpenAI grįžta į priekį

Balandžio 23 d. OpenAI paleido GPT-5.5, kodiniu pavadinimu „Spud”. Pirmas pilnai iš naujo apmokytas bazinis modelis nuo GPT-4.5 laikų.

Trys variantai: standartinis, Thinking ir Pro. SWE-bench rezultatas 88,7 proc., haliucinacijos sumažėjo 60 proc. Kaina dvigubai didesnė nei GPT-5.4, bet OpenAI teigia, kad efektyvumas tai kompensuoja. Gregas Brockmanis pavadino tai „nauja intelekto klase”.

DeepSeek V4: Kinija atsako per 24 valandas

Lyg būtų susitarę. Vos dieną po GPT-5.5, balandžio 24 d. DeepSeek paleido savo V4 seriją. Du modeliai: V4-Pro su 1,6 trln. parametrų (49 mlrd. aktyvių) ir V4-Flash su 284 mlrd. parametrų.

DeepSeek ir vėl daro tą patį triuką: panašus pajėgumas, mažesnė kaina. Abu modeliai turi 1 mln. tokenų konteksto langą ir yra atviro kodo su Apache 2.0 licencija. Nauja „Hybrid Attention Architecture” technologija pagerina ilgų pokalbių atmintį.

Kas svarbiausia: API palaiko ir OpenAI, ir Anthropic formatus. Perjungti nesunku.

Google Gemini Enterprise Agent Platform: Vertex AI mirė, gimė kažkas didesnis

Balandžio 22 d. Google Cloud Next konferencijoje paskelbė rimtą žingsnį. Vertex AI perkrikštytas į Gemini Enterprise Agent Platform. Tai nebe modelių paslauga, o pilna agentų kūrimo ir valdymo platforma.

Daugiau nei 200 modelių vienoje vietoje. Deep Research ir Deep Research Max, veikiantys ant Gemini 3.1 Pro, gali ieškoti ne tik viešame internete, bet ir įmonės vidiniuose dokumentuose. Google taip pat paskyrė 750 mln. dolerių partneriams agentinio DI kūrimui.

Claude Opus 4.7: Anthropic tyliai kyla

Balandžio 16 d. Anthropic išleido Opus 4.7. Gal ne šios savaitės naujiena, bet per pastarąsias dvi savaites tai buvo vienas svarbiausių releasų.

Kodavimo testuose SWE-Bench Pro pasiekė 64,3 proc., beveik 10 proc. daugiau nei Opus 4.6. Pirmas Claude modelis su aukštos raiškos vaizdų palaikymu (iki 2576px). Ir nauja „xhigh” mąstymo lygio nuostata, leidžianti tiksliau reguliuoti greičio ir gilaus mąstymo balansą.

O apie Claude Mythos, galingiausią Anthropic modelį, žinome tik tiek: Anthropic jį laiko po devyniais užraktais. Prieigą turi tik 50 organizacijų pagal Project Glasswing programą, ir naudojamas išskirtinai kibernetinio saugumo spragų paieškai.

Viso balandžio suvestinė

Kad geriau suprasi mastą, štai kas dar nutiko šį mėnesį:

  • Balandžio 2 d. Google išleido Gemma 4, stipriausią atviro kodo modelių šeimą su Apache 2.0 licencija
  • Balandžio 5 d. Meta paleido Llama 4 Scout ir Maverick
  • Balandžio 7 d. Anthropic patvirtino Claude Mythos egzistavimą
  • Balandžio 8 d. Meta pristatė Muse Spark, pirmąjį modelį iš Superintelligence Labs
  • Balandžio 16 d. Anthropic išleido Claude Opus 4.7
  • Balandžio 22 d. Google perkrikštijo Vertex AI į Gemini Enterprise Agent Platform
  • Balandžio 23 d. OpenAI išleido GPT-5.5
  • Balandžio 24 d. DeepSeek pristatė V4 seriją

Aštuoni dideli paleidimai per vieną mėnesį. Kai kurie per vieną savaitę.

Kas iš to seka?

Tendencija aiški. Modeliai vis dar greitėja, pinga (bent jau atviro kodo pusėje) ir tampa vis labiau savarankiški. Agentinis DI jau ne ateities vizija, o dabartis.

Post-LLM era, apie kurią rašėme, jau čia. Modeliai ne tik atsako į klausimus. Jie planuoja, vykdo, tikrina ir taiso savo darbą.

Praktinis klausimas tau: ar jau išbandei bent vieną iš šių naujų modelių? Jei ne, pradžiai užtenka nemokamų įrankių. O jei jau naudoji, parašyk komentaruose kuris tau pasirodė stipriausias.