Google Gemini Omni nutekėjo prieš Google I/O: ką žinome apie naują vaizdo modelį
·

Kartais geriausi pranešimai ateina ne iš scenų ir ne iš renginių – jie ateina per netyčinį nutekėjimą. Google I/O 2026 dar nebuvo pradėjęs, kai internete pasirodė eilutės kodo, atskleidžiančios tai, ko daugelis laukė: Gemini Omni – naujas vaizdo generavimo modelis.
Gegužės viduryje Gemini programėlės vartotojo sąsajoje buvo aptiktas tekstas: „Create with Gemini Omni: meet our new video model, remix your videos, edit directly in chat, try templates, and more.” Tai nebuvo oficialus pranešimas. Tai buvo eilutė, kurios neturėjo matyti niekas, išskyrus vidaus komandą.
Kas yra Gemini Omni
Pavadinimas „Omni” nėra atsitiktinis. Google jau turi Veo vaizdo generavimo sistemą ir Gemini kalbos modelius. Omni, regis, jungia abu pasaulius – tai modelis, galintis dirbti su vaizdu ir tekstu vienu metu, tiesiai pokalbio sąsajoje.
Trys tikėtini scenarijai:
- Omni kaip Veo plėtinys – naujas viešas Veo technologijos pavadinimas su patobulinta sąsaja
- Atskiras modelis – naujas Gemini vaizdo modelis, kuris veikia lygiagrečiai su Veo
- Unifikuota sistema – vienas modelis, tvarkantis tiek vaizdą, tiek video Gemini aplinkoje
Pirmieji demonstraciniai vaizdo įrašai yra įspūdingi. Matematikos profesorius ant lentos rašo trigonometrinės tapatybės lygtis – ir teksto atvaizdavimas toks tikslus, koks retai pasitaiko net kituose vaizdo modeliuose. Kita demonstracija: du vyrai vakarieniauja prie vandens, valgo spagečius, kalbasi. Detalės stebinančiai tikroviškos.
Redagavimas – stipriausia pusė
Vaizdo generavimas jau nėra naujiena. Sora, Runway, Kling – konkurencija čia aštri. Bet Gemini Omni pirmieji bandymai rodo, kad redagavimas gali būti tikroji pranašumo sritis.
Ankstyvieji testuotojai pranešė, kad modelis sugebėjo:
- Pašalinti vandenženklus iš esamų vaizdo įrašų
- Keisti objektus video klipuose pokalbio komandomis
- Perrašyti scenas – nekeičiant viso klipo, o tik konkrečios dalies
Tai nėra generavimas nuo nulio. Tai redagavimas. Ir tai keičia žaidimo taisykles turinio kūrėjams.
Vienas niuansas: modelis labai intensyviai naudoja išteklius. Du demonstraciniai klipai sunaudojo 86% vieno vartotojo dienos limitą AI Pro plane. Tai rodo, kad technologija brangi ir dar ne kiekvienam prieinama.
Google I/O 2026 ir kas bus toliau
Google I/O 2026 vyksta gegužės 19–20 dienomis. Tikėtina, kad Gemini Omni bus oficialiai pristatytas būtent ten. Nutekėjimas patvirtino, kad pranešimas artėja – klausimas tik apie kainodarą, prieinamumą ir kokias galimybes turės nemokamų planų vartotojai.
Google Gemini ir Android integracijos raida rodo, kad vaizdo funkcijos greičiausiai atsiras mobiliojoje programėlėje pirmiausia. Tai logiška – milijardai Android telefonų, milijardai potencialių vartotojų.
Kita vertus, DI agentų era reiškia, kad vaizdo generavimas nebus atskiras įrankis. Jis bus dalis didesnio darbo srauto – kur DI agentai kuria, redaguoja ir publikuoja turinį beveik be žmogaus įsikišimo.
Ką tai reiškia turinio kūrėjams
Jei kuriate vaizdo turinį – tai naujienai verta sekti iš arti. Ne dėl to, kad Gemini Omni jau dabar keičia viską. Bet dėl to, kad redagavimas pokalbio komandomis – „pakeisk šį personažą”, „pašalink foną”, „pridėk subtitrus” – tai yra ateitis.
DI įrankiai produktyvumui jau dabar taupo valandas. Vaizdo redagavimas yra viena labiausiai laiko reikalaujančių kūrybinių užduočių. Kai tai galės daryti DI tiesiai pokalbio lange – kūrybinio darbo modelis iš esmės pasikeis.
Kol kas – laukiame Google I/O. Gal oficialus pranešimas bus rytoj. Gal bus kita staigmena. Su Google niekada nežinai.
Kaip pasirinkti tinkamą DI įrankį – klausimas, kuris taps dar aktualesnis, kai rinkoje atsiras dar vienas galingas žaidėjas. Ir dabar jis atkeliauja iš Mountain View.


