Google tyliai uždarė Project Mariner. DI naršyklė, kuri pati lankydavosi svetainėse, dingo iš ekrano
·

Google šią savaitę uždarė vieną iš ambicingiausių savo DI eksperimentų. Project Mariner. Tai buvo naršyklės agentas, kuris žiūrėdavo į ekraną kaip žmogus, judindavo pelę, spaudžiodavo mygtukus ir už tave atlikdavo užduotis internete.
Niekas oficialiai nepranešė. Niekas nesurengė atsisveikinimo. Tiesiog projekto svetainėje atsirado mažytis užrašas. „Uždaryta gegužės 4 d.”

Kas buvo Project Mariner
Mariner pasirodė 2024 metų gruodį. Idėja buvo paprasta. Tu duodi DI naršyklei užduotį (užsakyk man šį viešbutį, palygink šių penkių parduotuvių kainas, suplanuok kelionę). Mariner atidaro Chrome, ima ekrano nuotraukas, atpažįsta mygtukus ir laukus, klikina vietoj tavęs. Vienu metu galėjo dirbti su 10 atvirų skirtukų.
Skambėjo kaip ateitis. Tu žiūri filmą, o naršyklė už tave užsako pizzą, atnaujina kelionės draudimą ir užpildo formą. Visi turėtume turėti tokį asistentą.
Tačiau praktikoje Mariner buvo lėtas, brangus ir dažnai klysdavo. Kai DI sprendimą priima žiūrėdamas į ekrano nuotrauką, jis turi atspėti, kur yra mygtukas. Kartais paspaudžia ne tą laukelį. Kartais užklysta į nuolaidos kuponų sukčių puslapį. Kartais tiesiog pasimeta, jei svetainė pakeičia dizainą.
Kodėl Google atsisakė šios technologijos
Tikroji priežastis paprasta. Pinigai. Mariner reikalauja milžiniškų skaičiavimo galių, nes kiekvieną sekundę DI turi apdoroti vaizdus. Lyginant su agentais, kurie tiesiog skaito HTML kodą arba kviečia API, Mariner kainavo apie 50 kartų brangiau.
Visa pramonė per pastaruosius mėnesius judėjo į priešingą pusę. Dabar madinga „file ir kodo lygio” agentai. Tokie kaip Anthropic Claude Computer Use arba OpenAI Operator. Jie veikia per terminalą ar API, ne per ekrano vaizdus. Greitesni, pigesni, patikimesni.
Ankstyvieji ženklai apie Mariner pabaigą buvo aiškūs jau kovą. Tada Google ėmė perkelti komandos narius į kitus projektus.
Tačiau technologija nepranyko
Įdomi detalė. Google teigia, kad „Mariner technologija iškeliavo į kitus Google produktus.” Praktiškai tai reiškia kelis dalykus.
Gemini Agent. Mariner branduolinis algoritmas pateko į naują Gemini užduočių automatizavimo sluoksnį. Skirtumas tas, kad Gemini Agent neveikia per naršyklę. Jis kviečia API tiesiogiai. Greitesnis, mažiau klaidų.
Google AI Mode paieškoje. Tos pačios technologijos suteikė galimybę paieškai atlikti veiksmus. Pavyzdžiui, parodyk man skrydžius ir užsakyk pigiausią. Be Mariner šis perėjimas nebūtų buvęs įmanomas.
Gemini API. Kūrėjai galės naudoti tas pačias galimybes per API. Tikėtina, kad netrukus pasirodys oficiali biblioteka.
Ką tai reiškia agentų pasauliui
Mariner pabaiga yra labai aiškus signalas. Vizualiai veikiantys agentai, kurie žiūri į ekraną, kol kas pralaimi tiems, kurie veikia per kodą.
Tai svarbu žinoti, jeigu galvoji apie DI integraciją savo versle. Apie agentinį DI rašėme atskirai. Šiandien rinkos lyderystę užima ne tie agentai, kurie atrodo įspūdingiausiai, o tie, kurie veikia patikimai ir nebrangiai.
Toks pat principas tinka OpenAI Workspace Agents. Jie irgi pereina prie API ir kreditų sistemos vietoj demonstracijų.
Alternatyvos, jei naudojai Mariner
Vartotojai, kurie pasiekė Mariner per Google Labs, jau gauna pranešimus apie alternatyvas. Štai trumpas sąrašas.
- Anthropic Claude Computer Use. Tas pats principas (DI valdo kompiuterį per ekrano nuotraukas), bet stabilesnis ir su geresne konsolinė kontrolė. Apie šitą agentą jau yra naujausių pakeitimų su Dreams funkcija.
- OpenAI Operator. Atskiras prenumeruojamas produktas, panašus į Mariner.
- Gemini Agent. Tiesiogiai per Gemini app. Jau veikia, bet kol kas tik apribotame regiono sąraše.
- Browserbase ir Puppeteer kartu su LLM. Kūrėjams. Ne demonstracinis produktas, o programavimo įrankis.
Vienas niuansas
Yra detalė, kuri nepateko į pranešimus. Mariner duomenų centruose Google sutaupė apie 12 procentų skaičiavimo galios pirmąją savaitę. Tai užtikrino papildomus pajėgumus Gemini modeliams.
Tas pats vyksta visoje pramonėje. Visi, kas turi DI infrastruktūrą, dabar atjungia silpnesnius produktus, kad sustiprintų stipriausius. Apie infrastruktūros lenktynes rašėme atskirai. Šiandienos sprendimas Google biure yra tos pačios logikos dalis.
Kas pamokoma
Mariner pamoka tinka ne tik DI pasauliui. Ji tinka bet kurioje technologijų srityje. Kartais didžiausi konceptualūs žingsniai per kelerius metus pasidaro neefektyvūs. Inžinieriai randa kitą būdą tą patį daryti pigiau.
Project Mariner neisstovėjo dvejų metų. Bet ji parodė, kas yra įmanoma. Ir Google tos dalies ne išmetė. Tik perdaužė į pigesnį formatą.
Praeityje toks žingsnis būtų užtrukęs penkerius metus. Dabar Google tai padarė per pusantro mėnesio nuo sprendimo iki uždarymo. Greitis, kuriuo DI pramonė save reorganizuoja, yra didesnis nei bet kada.


