NVIDIA Nemotron 3 Ultra: 550 mlrd. parametrų atviras modelis, kurį gali parsisiųsti nemokamai
·

Kalbant apie DI modelius, dauguma istorijų prasideda taip: „Korporacija investavo X mlrd. sukūrė milžinišką modelį, ir dabar tu jo negali naudoti, nebent moki mėnesinį mokestį.” Ši istorija yra kitokia.
NVIDIA birželio 4 dieną išleido Nemotron 3 Ultra, 550 mlrd. parametrų modelį su visais svoriais, duomenimis ir receptais. Jis yra nemokamas. Parsisiųsti gali iš HuggingFace dabar pat.
Tai neįprasta. Ir tai verta paaiškinti.
Kas yra Nemotron 3 Ultra ir kuo jis ypatingas
Nemotron 3 Ultra yra 550 mlrd. parametrų modelis, tačiau ne tradicinis tankusis modelis, tai Mixture-of-Experts (MoE) architektūra. Tai reiškia, kad vienu metu aktyvūs tik 55 mlrd. parametrų. Rezultatas: geresnis greitis ir mažesni skaičiavimo reikalavimai nei tradiciniai tokio dydžio modeliai.
Techniškai, hibridinis Mamba-Transformer architektūros modelis su 1 milijono žetonų konteksto langu. Inferencija yra 5 kartus greitesnė nei kiti atvirojo kodo frontieriniai modeliai, o sudėtingų agentinių užduočių kaina mažinama iki 30%.
Platinamas pagal OpenMDW 1.1 licenciją per Linux Foundation, tai reiškia komercinį naudojimą be specialių leidimų ir papildomų mokesčių.
Benchmarkų platforma Artificial Analysis paskelbė Nemotron 3 Ultra pasiekus 48 taškus AI Intelligence Index skalėje, padarydama jį pajėgiausiu atvirojo kodo modeliu, sukurtu JAV laboratorijoje. Kinijos Kimi K2.6 vis dar lenkia 6 taškais, bet veikia keliais kartais lėčiau.
Norint suprasti šio modelio vietą DI ekosistemoje, ypač agentiniame kontekste, verta peržiūrėti mūsų išsamų straipsnį apie tai, kas yra DI agentai ir kaip jie veikia.
Kodėl NVIDIA išleido tokį modelį nemokamai
Tai geras klausimas. NVIDIA nėra labdaros organizacija. Jų verslo modelis remiasi GPU pardavimu, ir čia slypi atsakymas.
Kuo daugiau žmonių ir kompanijų naudoja didelius DI modelius, tuo daugiau jiems reikia NVIDIA grafikos procesorių. Atvirojo kodo modeliai skatina eksperimentavimą, taikymą ir galiausiai, infrastruktūros pirkimą. Nemotron 3 Ultra yra marketingo strategija, paremta tikru technologiniu pasiekimu.
Tai protinga. Ir abu dalykai, ir strategiškumas, ir technologinis pajėgumas, yra tikri tuo pačiu metu.
Kaip rašėme anksčiau apie Google ir SpaceX infrastruktūros sandorį, DI infrastruktūros ekonomika jau seniai nėra technologijų nišos reikalas, tai milijardiniai skaičiai, kur kiekvienas žaidėjas apskaičiuoja kiekvieną žingsnį.
Bet esminis dalykas tau, kaip vartotojui ar kūrėjui: nesvarbu, kodėl NVIDIA tai padarė. Svarbu, kad tai yra prieinamas modelis, kuris veikia.
Kaip naudoti ir ką tai reiškia atvirojo kodo DI ateičiai
Nemotron 3 Ultra pasiekiamas per:
- HuggingFace, pilni modelio svoriai nemokamam parsisiuntimui
- NVIDIA NIM, optimizuota cloud inferencija
- OpenRouter, per API, apmokestinant pagal naudojimą
Tiesioginis modelio paleidimas lokaliai reikalauja rimtos GPU infrastruktūros, kalbame apie kelias A100 ar H100 korteles. Bet per NIM ar OpenRouter tai pasiekiama bet kam su interneto ryšiu.
Ilgesnėje perspektyvoje šis žingsnis yra svarbus signalas: frontieriniai atvirojo kodo modeliai pasiveja uždarus. Jei prieš metus skirtumas tarp geriausio atviro ir geriausio uždarojo modelio buvo didelis, dabar jis mažėja kiekvieną ketvirtį.
Ką tai reiškia kompanijoms? Galimybę kurti savo DI sprendimus nepriklausomai nuo OpenAI ar Anthropic licencijų ir kainos modelių. Galimybę paleisti modelį lokaliai, su pilnu duomenų kontroliavimu. Galimybę pritaikyti savo poreikiams.
Jei analizuoji DI įrankių pasirinkimą verslui, šis straipsnis padės suprasti, kada verta rinktis atvirojo kodo sprendimus ir kada, uždaruosius.
NVIDIA Nemotron 3 Ultra nėra revoliucija per vieną dieną. Bet tai dar vienas žingsnis link pasaulio, kur frontieriniai DI gebėjimai yra standartinė priemonė, o ne privilegija su mėnesiniais mokesčiais.
O tai, pripažinsim, yra įdomiau nei dar vienas uždaras modelis su stulbinančiais skaičiais reklamoje.


