Kinų DI šokas: Alibaba Qwen 3.7 Max lenkia Claude Opus ir kainuoja du kartus pigiau
·

Pasakysiu tiesiai: kai pirmą kartą pamačiau antraštę „kinų DI modelis pralenkia Claude Opus 4.7 per pusę kainos” — pirmoji mano reakcija buvo klasikinė.
Na, taip. Dar vienas benchmarkų žonglierius iš Rytų.
Bet tada pažiūrėjau į skaičius. Ir turiu prisipažinti — šį kartą čia kažkas tikrai keičiasi.
Gegužės 20-ąją Alibaba Cloud Summit konferencijoje Hangdžou mieste Kinijoje kompanija oficialiai pristatė Qwen 3.7 Max — naujausią savo DI modelį, sukurtą ne kasdieniniams pokalbiams, o ilgalaikiam autonominiam darbui. Tą modelį, kuris leidžia vienu kartu „perskaityti” tekstą, ilgesnį nei visas „Žiedų valdovas”.
35 valandos. 1 158 veiksmai. Be žmogaus
Alibaba paviešino vieną detalę, kuri mane sustabdė.
Qwen 3.7 Max buvo paleistas spręsti inžinerinės problemos ir dirbo 35 valandas nepertraukiamai. Per tą laiką atliko 1 158 įrankio kvietimus. Be vienos žmogaus intervencijos.
Ir ne tik dirbo — pasiekė 10 kartų spartesnį GPU branduolio optimizavimą užduočiai, kurios modelis niekada nebuvo matęs treniravimo metu. Tai nereiškia, kad DI tampa visagalis. Bet reiškia, kad autonominis agentinis darbas — ne tik reklaminis šūkis PowerPoint skaidrėse, o realiai veikianti funkcija.
Kontekstas — dar vienas raktinis žodis. Modelis turi 1 milijono tokenų konteksto langą. Praktiškai: jis vieno pokalbio metu gali „atsiminti” ir dirbti su maždaug 750 000 žodžių. Palyginimui — visas „Žiedų valdovas” yra apie 500 000 žodžių.
Skaičiai, dėl kurių nerimsta Vakarai
Benchmarkuose — objektyviuose nepriklausomuose testuose — Qwen 3.7 Max lenkia Claude Opus 4.6 Max trimis pagrindinėmis metrikomis: Terminal-Bench 2.0, SWE-Bench Pro ir MCP-Atlas. Tai nėra Alibaba marketingas. Tai matavimo rezultatai, kuriuos gali pakartoti bet kas, turintis prieigą prie API.
Bet galbūt svarbiausi yra ne benchmarkai, o kainos:
- Qwen 3.7 Max: $2,50 / $7,50 už 1 milijoną tokenų (įvestis / išvestis)
- Claude Opus 4.7: beveik dvigubai brangiau
Tai reiškia: jei valdai DI agentą, kuris per mėnesį apdoroja dešimtis milijonų tokenų — Qwen 3.7 Max tau gali sutaupyti tūkstančius eurų. Kas mėnesį.
Jau seniau rašiau apie tai, kaip Anthropic tapo brangiausia DI bendrove pasaulyje — 96,5 mlrd. dolerių vertinimas ir IPO planai. Tuo pačiu metu geriausi DI įrankiai programuotojams — Cursor, Claude Code — naudoja būtent Anthropic modelius. Šitam ekosistemų karams Qwen yra naujas dalyvis su rimtu kainos argumentu.
Kas čia iš tikrųjų vyksta?
Trumpai tariant — DI rinka tampa tikra rinka. Su konkurencija. Su kainų spaudimu. Ir tai tiesiogiai naudinga tau.
Kai „geriausias” modelis buvo vienas ar du, jų kūrėjai galėjo diktuoti kainas. Dabar, kai Kinija išleidžia modelį, kuris objektyviai kovoja su geriausiais, kaina tampa argumentu. OpenAI, Anthropic, Google tai supranta.
Neatsitiktinai Anthropic stiprina Project Glasswing — specializuotus modelius gynybos ir vyriausybiniam sektoriui. Ten, kur Kinijos kompanija tiesiog negalės konkuruoti dėl reguliacinių ir saugumo priežasčių. Tai ne pasitraukimas, o strateginis diferencijavimas.
Tuo tarpu paprastiems kūrėjams, startuoliams, smulkiam verslui — didėjanti konkurencija reiškia geresnes kainas. Ir tai yra aiškus laimėjimas.
Ar reikėtų pereiti prie Qwen?
Čia turėsiu būti atviras: viskas priklauso.
Jei esi programuotojas ar kuri DI agentus — Qwen 3.7 Max tikrai verta išbandyti. API prieiga per Alibaba Cloud Model Studio jau veikia. Kainos yra realiai mažesnės, o agentuose veikia gerai.
Jei naudoji DI turiniui, komunikacijai ar lietuviško konteksto užduotims — Claude ar GPT greičiausiai vis dar pranoksta. Qwen modeliai geriausiai moka kinų ir anglų kalbas. Lietuviškas kontekstas — dar atsilikimas.
Jei esi verslas, kuriam svarbus duomenų privatumas ar BDAR atitiktis — prisimink, kad Alibaba yra Kinijos kompanija. Duomenų kaupimas, galima valdžios prieiga — tai klausimai, kurie ne visiems svarbu, bet kai kuriems labai.
Ir viena paskutinė mintis, kuri man neduoda ramybės.
Kai geriausią DI įrankį galėjo nusipirkti tik stambus verslas — tai buvo privilegija. Kai ta pati kokybė ima kainuoti pusę — tai tampa prieinama daugiau žmonių. Alibaba nepaprašė leidimo dalyvauti šiame žaidime. Jie tiesiog atvyko su geresniais skaičiais.
Tai yra ir gera žinia tau, ir perspėjimas vakarietiškiems DI milžinams — vienu metu.


