,

Gemini 3.5 Flash: kodėl Google naujasis DI modelis sugrąžino Google į lenktynes

·


Pirmadienį gulėjau ir skaičiau naujienas. Žinai tą jausmą, kai pamatai kažką ir galvoji — na ir kas? Toks buvo mano pirmas reakcija į Google Gemini 3.5 Flash anonsą. Dar vienas modelis. Dar viena versija. Dar vienas numeris po skaičiumi.

Bet tada pradėjau skaityti skaičius. Ir palaukiau minutę.

4x greičiau nei kiti vadinamieji frontier modeliai. 10x pigiau nei Claude Opus 4.7. Ir per kai kuriuos testus — aplenkia abu.

Gerai. Google pagaliau pasistengė.

Kas yra Gemini 3.5 Flash ir kodėl visi apie jį kalba

Gemini 3.5 Flash buvo pristatytas gegužės 19 dieną, Google I/O 2026 konferencijoje. Tai pirmasis modelis naujoje Gemini 3.5 serijoje, kurią Google pozicionuoja kaip „frontier intelligence with action” — t.y. ne tik protingas, bet ir veikiantis.

Ką tai reiškia praktiškai? Modelis specialiai optimizuotas DI agentų užduotims — tokioms, kur DI turi ne tik atsakyti į klausimą, bet planuoti, atlikti kelis veiksmus iš eilės, naudoti įrankius. Jei nori suprasti, kas tie DI agentai apskritai, skaityk čia — paaiškinau detaliai.

Gemini 3.5 Flash palaiko tekstą, paveikslėlius, garsą ir vaizdo įrašus. Konteksto langas — 1 milijonas tokenų. Tai reiškia, kad galima įkišti didžiulę knygą ir paprašyti santraukos. Arba visą kodų bazę.

Skaičiai, kurie pakeičia žaidimą

Bet kalbėkime apie tai, kas iš tikrųjų svarbiausia. Greitis ir kaina.

Gemini 3.5 Flash generuoja 289 tokenų per sekundę. Palyginimui: Claude Opus 4.7 — 67 tok/s, GPT-5.5 — 71 tok/s. Tai ne šiek tiek greičiau. Tai beveik keturis kartus greičiau.

Kaina? $1.50 už milijoną įvesties tokenų ir $9.00 už išvesties. Claude Opus 4.7 kainuoja $15 įvestyje ir $75 išvestyje. GPT-5.5 — $5 ir $15 atitinkamai.

Jei žaidi su DI kaip hobiu, skirtumo beveik nejusi. Bet jei turi produktą, kuris kasdien procesina milijonus užklausų — tai skirtumas tarp pelningumo ir nuostolių.

Benchmarkai: kur Gemini laimi, kur pralaimi

Čia įdomiausia dalis. Nes paprastai greitas + pigus = prastas. Bet ne šį kartą.

Gemini 3.5 Flash laimi šiose srityse:

  • MCP Atlas (įrankių naudojimas) — 83.6%, aplenkia Opus 4.7 ir GPT-5.5
  • CharXiv Reasoning (multimodalinis supratimas) — 84.2%
  • Terminal-Bench 2.1 (kodavimas) — 76.2%, beveik lygus su GPT-5.5 (78.2%)

Kur pralaimi:

  • SWE-Bench Pro (realaus kodo keitimas) — čia Claude Opus 4.7 gerokai stipresnis (64.3%)
  • ARC-AGI-2 (gilus samprotavimas) — GPT-5.5 pirmauja

Esmė paprasta: nėra vieno modelio, kuris laimi viską. Bet Gemini 3.5 Flash yra labai geras ten, kur dauguma verslo sprendimų ir reikalingi — agentinės užduotys, įrankių naudojimas, daugiamediinis apdorojimas. Jei tave domina, kaip šie modeliai lyginasi kasdieniniame naudojime, lyginamąją analizę jau esu parašęs.

Kas jau naudoja ir kaip

Google nepaliko tik teorinių skaičių. Prie pristatymo prisijungė konkretūs vardai: Shopify, Macquarie Bank, Salesforce, Ramp, Xero, Databricks.

Shopify — duomenų analizei. Macquarie Bank — dokumentų samprotavimui. Ramp — finansinių dokumentų OCR ir sudėtingiems darbų srautams.

Tai ne PR. Tai realus diegimas realiuose versluose. Ir tai kalba garsiau nei bet kokie benchmarkai.

Google taip pat pristatė Managed Agents API — infrastruktūros sluoksnį, kuris leidžia DI agentams turėti nuolatinę būseną ir atlikti ilgas daugiažingsnės užduotis. Tai skirta tiems, kurie stato rimtus produktus, o ne tik testuoja chatbotus. Google I/O 2026 informacinių agentų pristatyme apie tai rašiau anksčiau — ten daugiau konteksto.

Ką tai reiškia tau

Jei esi kūrėjas ar startuolis — Gemini 3.5 Flash yra aiški investicija. Mažesnė kaina, didesnis greitis, neblogas tikslumas. Idealus prototipams ir agentinės logikos testavimui.

Jei esi verslas, kuris jau naudoja DI API — verta perskaičiuoti. Priklausomai nuo naudojimo atvejo, gali sutaupyti nemažą dalį kaštų neprarasdamas kokybės.

Jei esi tiesiog smalsus žmogus — tai signalas, kad DI rinka 2026-aisiais nebėra dviejų žaidėjų monopolija. Google grįžta rimtai.

O jei dar tik pradedu naudoti DI darbe — čia parašiau 5 žingsnius, kaip pradėti šiandien, nesvarbu kokį modelį pasirinksi.

DUK apie Gemini 3.5 Flash

Ar Gemini 3.5 Flash prieinamas nemokamai?

Nemokamas naudojimas galimas per Gemini programėlę ir Google AI Studio su apribojimais. Pilnas API priėjimas mokamas — $1.50/$9.00 už milijoną tokenų.

Kada buvo išleistas Gemini 3.5 Flash?

Gegužės 19 dieną, 2026, Google I/O konferencijoje Montain View, Kalifornijoje.

Ar Gemini 3.5 Flash geresnis už ChatGPT?

Priklauso nuo užduoties. Agentinėse ir multimodalinėse užduotyse — taip. Giliam samprotavimui ir kompleksiniams kodo pakeitimams — ne visada.

Ar galiu naudoti Gemini 3.5 Flash verslui?

Taip. Pasiekiamas per Gemini Enterprise Agent Platform ir Google Cloud. Shopify, Salesforce ir kiti jau naudoja gamybinėje aplinkoje.

Kokia Gemini 3.5 Flash konteksto lango talpa?

1 048 576 tokenai įvestyje, 65 536 tokenai išvestyje. Tai leidžia apdoroti labai ilgus dokumentus vienu kartu.

Trumpai: Google Gemini 3.5 Flash yra realus žingsnis, ne tik PR. 4x greitis ir iki 10x mažesnė kaina, išlaikant konkurencingą tikslumą, keičia skaičiavimą verslo DI integracijos sprendimams. DI lenktynės 2026-aisiais dar toli gražu nesibaigė.