DI autorių teisių byla yra didžiausias šio dešimtmečio teisinis konfliktas. Ir Lietuva neliks šalia
·

Kai šįryt skaičiau apie Hachette ir Scott Turow ieškinį prieš Metą, supratau vieną dalyką. Tai nėra eilinis JAV teisinis kazusas, kuris pamiršamas po pusmečio. Tai yra didelio masto konfliktas, kuris perkurs visą DI ekonomiką per ateinančius penkerius metus. Ir Lietuva, nors atrodo nuošalyje, neliks šalia.
Mano nuomonė paprasta. Mes esame istorinio momento liudininkai. Toks dažnumo lygmens kaip muzikos pramonės persitvarkymas po Napster’io ar žiniasklaidos sektoriaus krizė po Google ir Facebook iškilimo. DI dabar artėja prie savo Napster momento.
Kodėl ši byla yra didžiausia
Anksčiau buvo bylų. New York Times prieš OpenAI. Universal Music prieš Anthropic. Knygų autorius Sarah Silverman prieš Metą. Visi reikšmingi, bet riboti.
Hachette ir kitų leidėjų ieškinys yra kitokia kategorija dėl trijų priežasčių. Pirma, čia yra dokumentinis įrodymas. Vidiniai Meta laiškai rodo, kad Mark Zuckerberg asmeniškai leido piratauti. Tai nebėra interpretacija – tai įrodyta veika.
Antra, į ieškinį įtraukti penki didžiausi pasaulio leidėjai. Hachette, Macmillan, McGraw Hill, Elsevier, Cengage. Jie turi resursus, ryšius ir ne pirmą kartą veda strategines bylas. Tai nėra individualūs autoriai be teisinio palaikymo.
Trečia, byla pateikta klasės ieškinio formoje. Jei teismas tai pripažins, prie ieškinio prisijungs šimtai tūkstančių autorių. Žaidimas tampa ne 200 milijonų dolerių, o galimai milijardų klausimu.
Kodėl tai paveiks visą DI sektorių
DI modelių apmokymas yra paslaptingas procesas, apie kurį dauguma žmonių žino mažai. Bet pamatas yra paprastas. Modeliai mokosi iš teksto. Ir geriausias tekstas yra knygose, kurios buvo redaguotos profesionalų, peržiūrėtos redaktorių ir perduotos per kokybės kontrolę.
Wikipedia ir interneto forumai duoda savo tūrį, bet kokybiškas turinys ateina iš leidyklų. Ir tos leidyklos dabar yra ant baronkamų. Jei jos laimi, DI sektorius gauna naują biudžeto liniją – duomenų licencijavimą.
Kalbama apie didelius pinigus. Anthropic ką tik užsisakė 200 milijardų dolerių infrastruktūrai iš Google. Tai yra reikšminga investicija. Bet duomenų licencijavimas gali pridėti dar 10-20 procentų prie šių sąnaudų. Tai paveiks galutinę DI paslaugų kainą.
Kas iš to laimės, o kas pralaimės
Konfliktas turės aiškius laimėtojus ir pralaimėtojus.
Laimėtojai. Didieji DI žaidėjai – OpenAI, Anthropic, Google, Microsoft. Jie turi pinigus mokėti licencijas. Jie tampa standarto kūrėjais. Jie užfiksuoja rinką prieš mažesnių startuolių iškilimą.
Antri laimėtojai yra didieji leidėjai. Hachette, News Corp, Penguin Random House. Jie gauna naują pajamų srautą. Knygų pardavimai stagnuoja, bet duomenys, kuriuos jie turi, tampa aukso vertės.
Pralaimėtojai. Pirmieji yra atvirojo kodo DI judėjimas. Kai apmokymas tampa brangus, jis tampa nepakelis nedidelėms organizacijoms. Hugging Face, Mistral ir kiti turės adaptuotis arba prarasti pranašumą.
Antri pralaimėtojai yra individualūs autoriai. Klasės ieškinys gali baigtis sutartimi. Sutartys reiškia kompensacijas leidykloms, ne tikriesiems autoriams. Pinigai, jei jie pasieks autorius, ateis maži ir vėluodami.
Kodėl Lietuva neliks šalia
Atrodytų, kad JAV teismų sprendimai mums neturi tiesioginės reikšmės. Iš dalies tiesa. Bet yra trys mechanizmai, per kuriuos efektai pasieks Lietuvą.
Pirma, modelių prieinamumas. Dauguma LT verslų naudoja amerikietiškus DI modelius – ChatGPT, Claude, Gemini. Jei JAV teismas pripažins reikalavimus licencijuoti, modelių kaina kils. LT vartotojai mokės brangiau.
Antra, ES atsakas. Europos Sąjunga jau dirba prie AI Act’o ir copyright direktyvos. JAV teismų sprendimai įtakos europiečių požiūrį. Dažnai ES priima dar griežtesnes taisykles nei amerikiečiai.
Trečia, lietuvių kalbos modeliai. Šiuo metu lietuvių kalba apmokymas remiasi Wikipedia ir interneto turinį. Jei standartas pasikeis, lietuvių leidyklos, kaip „Tyto alba” ar „Alma littera”, gali tapti svarbiais žaidėjais. Arba kliūtimi, jei jos blokuos prieigą.
Mano prognozė
Per ateinančius 18 mėnesių pamatysime tris dalykus.
Pirma, daugiau bylų. Kiti leidėjai prisijungs. Hollywood’as, muzikos pramonė, žiniasklaida, akademiniai leidiniai. Visi norės savo dalies.
Antra, sutartys vietoje teismų. Didieji DI žaidėjai pradės derėtis tiesiogiai. OpenAI jau turi sandorius su News Corp ir Wall Street Journal. Daugiau ateis.
Trečia, naujas DI sluoksnis. Specializuoti modeliai, kurie apmokomi tik su licencijuotais duomenimis. Jie kainuos brangiau, bet teisiškai bus saugūs. Verslams, kuriems svarbu compliance, jie taps standartu.
Ką turėtų daryti LT verslas
Du konkretūs žingsniai šiandien.
Pirma, paklausk savo DI tiekėjo apie copyright compliance. Kaip jie apmoko savo modelius? Ar yra licencijos su pagrindiniais leidėjais? Atsakymai dabar atrodys neaiškūs. Per metus jie bus standartiniai sutartyse.
Antra, vertink riziką savo DI naudojimo procesuose. DI projektų valdyme svarbu žinoti, kaip jūsų sprendimai veiks, jei tiekėjas pakeis sąlygas dėl teisinių iššūkių.
Galutinis taškas. Mes gyvename DI istorijos lūžio momentu. Kas šiandien atrodo kaip techninis ginčas tarp Meta ir leidėjų, rytoj bus standartas, pagal kurį dirbs visa pramonė. Ir tas standartas paveiks ne tik Silicio slėnį, bet ir Vilniaus verslo centrus.
Kas pasiruoš anksčiau, laimės. Kas lauks teismo sprendimo, atsiras situacijoje, kur taisyklės jau parašytos kažkieno kito.

