,

Hachette ir Scott Turow padavė Metą į teismą. 267 TB knygų piratavimas Llama modeliui

·


Penki stambūs leidėjai ir bestselerių autorius Scott Turow gegužės 5 dieną padavė Metą į federalinį teismą Kalifornijoje. Kaltinimas paprastas. Mark Zuckerberg asmeniškai leido jo komandai parsisiųsti daugiau nei 267 terabaitų knygų iš piratinės bibliotekos LibGen, kad apmokytų savo Llama modelį.

Ieškinį iškėlė Hachette, Macmillan, McGraw Hill, Elsevier ir Cengage kartu su autoriumi Scott Turow. Visi reikalauja klasės pripažinimo. Tai reikštų, kad prie ieškinio gali prisijungti tūkstančiai kitų autorių ir leidėjų.

Ką tiksliai padarė Meta

Pagal teismui pateiktus dokumentus, Meta inžinieriai 2023 metais pradėjo derybas su leidėjais dėl licencijų. Komanda apskaičiavo, kad licencijos kaštai galėtų siekti apie 200 milijonų dolerių per metus. Tai buvo per brangu.

Sprendimas atėjo iš pačio Zuckerbergo. Vidiniai Meta laiškai rodo, kad jis pasakė komandai paprasčiau ir pigiau parsisiųsti viską iš LibGen ir Anna’s Archive. Abi yra didžiausios pasaulyje piratinės bibliotekos.

Inžinierių susirašinėjimuose, kuriuos teismas atskleidė, vartojami atviri terminai. „Užsisakome torrent”. „Imkime visą Anna’s Archive snapshot”. Kalbama apie 267 terabaitus. Tai daugiau nei visos JAV Kongreso bibliotekos skaitmeninis turinys kartu paėmus.

Kodėl ši byla skiriasi nuo kitų

DI kompanijos jau metus sulaukia bylų dėl autorių teisių. New York Times padavė OpenAI. Universal Music kalbasi su Anthropic. Bet Meta atvejis kitoks dėl trijų priežasčių.

Pirma, čia yra tiesioginė įrodymų grandinė. Vidiniai laiškai, Zuckerbergo asmeninis sprendimas, konkretūs failų skaičiai.

Antra, čia yra aiškus piratavimo elementas. OpenAI ir Anthropic, kuris ką tik pasirašė 200 mlrd. dolerių sandorį su Google, naudojo viešai pasiekiamą tekstą iš interneto. Meta tiesiogine prasme parsisiuntė knygas iš pripažintos piratinės platformos.

Trečia, ieškiniui priklauso ne tik autoriai, bet ir didžiausi pasaulio leidėjai. Hachette ir Macmillan turi resursų vesti ilgą bylą.

Kas iš to seka DI sektoriui

Jei teismas pripažins Meta kaltę, sektoriuje keisis trys dalykai.

Pirma, modelių apmokymo kaštai išaugs. Licencijos su didžiaisiais leidėjais netoli 200 milijonų per metus, kuriuos Meta atsisakė mokėti, taps standartiniu mokesčiu.

Antra, atsiras naujas duomenų rinkos sluoksnis. Anthropic, OpenAI ir Google jau pasirašė licencijos sutartis su didelėmis žiniasklaidos grupėmis. Šis ieškinys paspartins panašius sandorius. Lenktynės dėl DI infrastruktūros dabar persikels ir į duomenų licencijavimo lygmenį.

Trečia, mažesnės DI kompanijos atsidurs spąstuose. Jei joms reikės licencijų visam apmokymo turiniui, į rinką patekti taps daug sunkiau. Tai naudinga tik dideliems žaidėjams.

Ką tai reiškia Lietuvoje

Lietuvoje veikiantys DI projektai paprastai naudoja jau apmokytus modelius, ne treniruoja savo. Tad tiesioginio poveikio mažai. Bet yra netiesioginis efektas.

Jei Meta pralaimės bylą, Llama atvirojo kodo modelio plėtra sulėtės. O Llama yra populiarus pasirinkimas LT verslams, kurie nori turėti DI sprendimus savo serveriuose. Galimas variantas, kad Meta ateityje griežčiau kontroliuos, kas ir kaip naudoja Llama.

Praktinis patarimas. Jei tavo verslas remiasi atvirojo kodo DI modeliais, pasidomėk alternatyvomis. Mistral, Qwen, DeepSeek ir kiti tiekėjai dabar laikosi atskiro saugumo ir licencijavimo modelio. Diegiant DI procesų valdyme svarbu suprasti ne tik kainą, bet ir teisinę modelio kilmę.

Kodėl tai svarbu už DI ribų

Ši byla yra didesnė nei atrodo. Ji bandys atsakyti į klausimą, kuris paveiks visą DI ekonomiką. Ar treniravimas remiantis cituojamais autorių darbais yra fair use, ar piratavimas?

JAV teismai jau skirtingai sprendžia panašius klausimus. Žemesni teismai linksta DI kompanijų pusėn. Apeliaciniai teismai dažniau gina autorius. Aukščiausiasis teismas dar nepasisakė.

Meta byla galėtų būti būtent ta, kuri nukeliautų į patį viršų. Tada visa DI pramonė turės naują standartą. O ir Lietuvos verslai, dirbantys su DI, turės žinoti, ar jų naudojami modeliai buvo apmokyti teisėtai.