Google DeepMind Gemini Robotics-ER 1.6: robotai, kurie supranta pasaulį kaip žmogus
·

Robotas turi pakelti puodelį nuo stalo. Skamba paprastai? Žmogui – taip. Robotui – beveik neįmanoma problema. Iki dabar.
Google DeepMind pristatė Gemini Robotics-ER 1.6 – modelį, kuris leidžia robotams suvokti aplinką su tokiu tikslumu, kokio dar nebuvo.
Kas jame ypatingo
„Reasoning-first” architektūra. Modelis pirma galvoja, paskui veikia. Jis ne tik mato objektą – jis supranta erdvinius santykius, fizines savybes, galimus veiksmus. Gali parodyti pirštu ir suskaičiuoti objektus scenoje. Skamba trivialiai, bet robotikai tai – milžiniškas šuolis.
Boston Dynamics jau integravo šį modelį į savo Orbit platformą ir AIVI (AI Visual Inspection) sistemas. Tai reiškia, kad Spot robotai gamyklose dabar „mato” ir „supranta” geriau.
Kontekstas
NVIDIA GR00T robotikos platforma jau veikia. NVIDIA prognozuoja, kad kiekviena pramonės įmonė taps robotikos įmone. Google su Gemini Robotics-ER bando užimti „smegenų” dalį – modelį, kuris valdo roboto sprendimus.
145 mln. autonominių mašinų iki 2035 – šis skaičius reikalauja tokių modelių kaip Robotics-ER.
Kinija planuoja 100 000 humanoidinių robotų gamybą. Google nori, kad tie robotai veiktų su Gemini smegenimis.
Robotas, kuris supranta pasaulį. Ar tai jau pradžia to, apie ką kalbėjo sci-fi filmai?


