Google naujais lustais meta iššūkį NVIDIA: TPU8 skirtas inference
·

Bloomberg praneša: Google ruošia naujus DI lustus, orientuotus specifiškai į inference – tai yra DI modelių veikimą, ne treniravimą. Tiesioginis smūgis NVIDIA dominavimui.
Iki šiol NVIDIA kontroliavo ir treniravimo, ir inference lustų rinką. Google sako: pakaks.
Kodėl inference svarbu
Treniravimas – tai kai DI modelį mokai. Inference – tai kai jis dirba. Kiekvieną kartą, kai naudoji ChatGPT, Gemini ar Claude – tai inference. Ir inference lustų paklausa auga greičiau nei treniravimo.
Google jau turi TPU (Tensor Processing Unit) lustus savo duomenų centruose. Naujoji karta skirta būti greitesnė ir pigesnė nei NVIDIA H100 ir B200 inference režimu.
Kontekstas
Puslaidininkių industrija pasiekė 975 mlrd. piką. TSMC pelnas šoko 58%. Lustų rinka – karščiausia tech sritis. Google nori dalies to pyrago.
OpenAI ir Cerebras jau sudarė 20 mlrd. lustų sandorį, siekdami sumažinti priklausomybę nuo NVIDIA. Google eina tuo pačiu keliu.
NVIDIA pozicija
NVIDIA vis dar dominuoja. Hannoverio mugėje parodė Industrial AI Cloud. Bet monopoliai tech industrijoje niekada netrunka amžinai.
Kai Google, Amazon (Trainium), ir Microsoft (Maia) visi kuria savo lustus – NVIDIA turės kovoti sunkiau. Ar tai gera žinia vartotojams? Tikrai taip – konkurencija mažina kainas.


