,

NVIDIA paskelbė Vera Rubin architektūrą. H300 GPU ir nauja foundry — viskas šįmet.

·


Šią savaitę NVIDIA inžinerijos blog’e pasirodė techninis pranešimas, kuris konkurencingiems lustų gamintojams ne pati gera žinia. „Vera Rubin” pavadinta nauja DI lustų architektūra, su H300 GPU šerdimi, su atskira AI foundry custom silicon gamybai. Pilna gamyba — iki šių metų pabaigos.

Mikročipas — NVIDIA Vera Rubin yra didžiausias architektūrinis šuolis nuo 2022 metų

KAS YRA H300

NVIDIA H300 yra naujasis flagship GPU. Pakeičia H200, kuris buvo pristatyta 2024 metų pabaigoje. Pagrindiniai pakitimai trys.

Pirma, atminties pajėgumas. H300 turi 192 GB HBM4 atminties (palyginimui H200 turėjo 141 GB HBM3e). Tai svarbu DI inference užduotims, kur visa modelio „svoriai” turi tilpti į vieno lusto atmintį.

Antra, tarpkonektoriai. Naujas NVLink 6 standartas leidžia 8 H300 lustams veikti kaip vienas didelis sistemo. Anksčiau buvo apribota iki 4 lustų. Skirtumas didelis didelių modelių apmokymui.

Trečia, energijos suvartojimas. H300 yra 30 procentų efektyvesnis nei H200. Tai mažina elektros sąskaitas duomenų centruose, kurios jau dabar viršija 30 šalių elektros pajamas.

KAS YRA AI FOUNDRY

Antrasis paskelbimas dar svarbesnis ilgalaikiu požiūriu. NVIDIA atveria savo gamybos pajėgumus kitoms įmonėms, kurios nori turėti savo custom silicon dizainus. Tai yra tas pats, ką TSMC daro keliasdešimt metų. Bet NVIDIA pridėjo vieną dalyką. Specializuotą DI dizaino sluoksnį.

Praktiškai. Jeigu Anthropic nori savo specialios architektūros lustų (jie ką tik pradėjo kalbas su Fractile), jie galės kreiptis į NVIDIA AI foundry. NVIDIA suteiks dizaino įrankius, gamybos prieigą, ir galiausiai pristatys gatavus lustus.

Tai NVIDIA strategija. Užimti vietą ne tik pirminių GPU rinkoje, bet ir kitų įmonių „lustų alternatyvose”. Net jei Meta savo MTIA lustus nesusivedinės su NVIDIA, jie greičiausiai naudos NVIDIA gamybos paslaugas.

KO TAI REIŠKIA

NVIDIA dominavimas DI lustų rinkoje šįmet pasiektų naują viršūnę. Apie 80 procentų pasaulinio inference apkrovos jau veikia ant NVIDIA produktų. Su H300 ir AI foundry šitas skaičius gali pasiekti 90 procentų.

Konkurentai (AMD, Intel, kinų SMIC) reikalauja vieno dalyko. Kainos. DRAM kainos jau pakilo 95 procentais per ketvirtį. Kai NVIDIA dominuoja, jie gali kainas dar pakelti. Tai paveiks visus DI vartotojus, įskaitant tave.

KO TAI EUROPAI

Lietuvai šitas paskelbimas konkrečiai reiškia vieną dalyką. LitAI duomenų centras ateityje galės pasirinkti tarp dvejų variantų. Pirma, mokėti NVIDIA ir gauti H300 lustus, kurie veiks geriausiai. Antra, mokėti pigiau už alternatyvius gamintojus, bet su menkiau patikima rezultata.

Daugumai DI naudojimo atvejų pirmas variantas geresnis. Bet tai reiškia tiesioginę priklausomybę nuo JAV gamintojo. Europos „suverenios DI” idealas šito sąjungos negali sumažinti, kol Europa pati savo lustų gamybos neturės.

Tu kaip žiūri į NVIDIA monopoliją? Ar tai gera DI ekosistemai, ar bloga? Parašyk komentaruose.