DeepSeek V4: trilijono parametrų modelis ant Huawei lustų už 5,2 mln. dolerių
·

5,2 milijono dolerių. Tiek kainavo ištreniruoti modelį, kuris konkuruoja su tais, kuriem GPT-5 kainavo šimtus milijonų.
Ir jis veikia ant kiniškų lustų.
TRILIJONO PARAM ETRŲ UŽ CENTUS
DeepSeek V4 – naujas DI modelis iš Kinijos, kuris oficialiai turi 1 trilijona parametrų. Bet gudrumas toks – naudojant Mixture-of-Experts architektūrą, kiekvienam atsakymui aktyvuojasi tik 37 mlrd. parametrų.
Tai reišk ia, kad modelis turi trilijono žinių bazę, bet veikia taip greitai, tarsi būtų 37 mlrd. modelis. Protinga.
NE NVIDIA. HUAWEI
Štai kas šioje istorijoje svarbiausia. DeepSeek V4 treniruotas ant Huawei Ascend 910B ir Cambricon MLU lustų. Ne ant Nvidia GPU.
Tai pirmas frontier DI modelis, sukurtas visiškai ant kiniškos puslaidininkiu infrastruktūros. Samsung ir Nvidia dominavimas DI lustuose turi naują konkurentą.
JAV sankcijos turėjo sustabdyti Kinij os DI progresą. Kaip matome – nesustabdė.
BENCHMARKS
DeepSeek skelbia įspūdingus skaičius:
- HumanEval: 90%
- SWE-bench: virš 80%
- Konteksto langas: 1 mln. tokenų
- Needle-in-a-Haystack: 97% tikslumas
Kaina? $0.30 už milij oną tokenų. Palygink su GPT-5.4 kainomis.
OPEN SOURCE: APACHE 2.0
Ir dar vienas smūgis Vakarų DI kompanijoms – DeepSeek V4 bus prieinamas su Apache 2.0 licencija. Visiškai atviras kodas. Naudok, keisk, pardavinėk.
Kol Anthropic blokuoja prieigą ir kelia kainas, DeepSeek duoda viską nemokamai.
KĄ TAI REIŠK IA
DI lenktynės tarp JAV ir Kinijos įgauna naują posūkį. Kinija ne tik sugeba kurti konkurencingus modelius – ji daro tai ant savo lustų, už mažes nį kainą, ir dar dalina nemokamai.
Tai yra situacija, kurios Vakarų DI kompanijos labiausiai bijojo. Ir ji jau čia.
DUK
Kas yra DeepSeek V4?
Kinijos DI modelis su trilijonu parametrų, treniruotas ant Huawei lustų, prieinamas nemokamai.
Ar jis tikrai konkuruoja su GPT-5?
Benchmarkų skaičiai rodo kad taip, bet nepriklausomų testų dar trūksta.
Ar galiu juo naudotis?
Taip – Apache 2.0 licencija leidžia naudoti komerciniais tikslais.
Daugiau apie DI technologijas.


