ElevenLabs perlipo 500 mln. dolerių pajamų ribą. Jamie Foxxas, BlackRock ir NVIDIA jau lipa į tą patį traukinį
·

Eva Longoria. Jamie Foxxas. „Squid Game” kūrėjas Hwang Dong-hyukas. Tai ne Holivudo vakarėlio svečių sąrašas. Tai investuotojai, kurie ką tik pasirašė čekius ElevenLabs – lietuviams dar nelabai pažįstamai, bet vienai įdomiausių balso DI kompanijų pasaulyje.

Kompanija gegužės 6 dieną oficialiai pranešė peržengusi 500 mln. dolerių metinių pasikartojančių pajamų ribą. Praėjusių metų pabaigoje skaičius buvo 350 mln. Per kelis mėnesius – šuolis 43 procentais.
Kartu su pranešimu apie pajamas ElevenLabs paskelbė ir Series D etapą. Bendra rinkos vertė – 11 mlrd. dolerių. Iš viso šiame rate kompanija jau surinko per 550 mln.
KAS YRA ELEVENLABS
Jeigu nesi girdėjęs – nieko keisto. ElevenLabs Lietuvoje žinoma siaurame rate. Bet jei kada nors klausėsi DI sugeneruoto balso „YouTube” video, žiūrėjai dubliuotą filmą be tikro aktoriaus arba bandei savo balsu klonuoti pasaką vaikui – veikiausiai naudojai jų variklį.
Kompanijos esmė paprasta. Jie generuoja žmogiškai skambančius balsus iš teksto. Klonuoja realaus žmogaus balsą iš kelių sekundžių įrašo. Verčia balsą iš vienos kalbos į kitą išlaikydami tembrą. Daro tai geriau už visus kitus rinkoje.
Mati Staniszewskis, ElevenLabs vadovas, neseniai sakė: „Norint laimėti įmonių pasitikėjimą, reikia tikrai žmogaus lygio DI balso modelių, ne robotiškai skambančių sistemų.”
Praktiškai tai reiškia, kad „Revolut” klientų aptarnavimo skambučius dabar gali atsiliepti DI agentas, kalbantis lietuviškai be akcento. Klarna naudoja juos klientų aptarnavimui ir pardavimams. Deutsche Telekom integravo į savo skambučių centrus.
KODĖL SVARBU TAS INVESTUOTOJŲ SĄRAŠAS
Pažiūrėk į investuotojų sąrašą. BlackRock – didžiausias pasaulio turto valdytojas, valdantis 11 trilijonų dolerių. Wellington. D.E. Shaw. Salesforce Ventures. Deutsche Telekom. NVIDIA. Tai ne investicinis fondas, kuris stato ant 100 startuolių tikėdamasis vieno taikinio. Tai institucijos, kurios investuoja tik kai mato kelią į milijardus.
Bet dar įdomiau kita dalis. Jamie Foxxas. Eva Longoria. Hwang Dong-hyukas. Holivudas pradeda investuoti į balso DI. Logiška – kas geriau supranta balsą kaip turtą, jei ne aktoriai, kurie iš jo gyvena?
Reikia pripažinti – prieš dvejus metus tas pats Hwang būtų protestavęs prieš DI balsus. Dabar jis investuoja. Tai didžiausias signalas, kad balso klonavimas tampa ne grėsme, o nauja pajamų sritimi tiems, kurie pirmieji prisitaikė.
KĄ TAI REIŠKIA LIETUVOJE
Sėdžiu prie kompiuterio ir bandau įsivaizduoti, ką tai keičia kasdienėje darbo aplinkoje.
Atsakymas – daug.
Mažam Lietuvos verslui, kuris turi du klientų aptarnavimo darbuotojus dirbančius nuo 9 iki 17, ElevenLabs reiškia galimybę turėti DI agentą atsakantį į skambučius 24 valandas per parą. Lietuviškai. Mandagiai. Atpažįstantį dažniausius klausimus ir žinantį, kada perduoti žmogui.
Kainos krito. Kompanija drauge su pranešimu apie ARR paskelbė didelį balso ir agentinių API kainų sumažinimą. Tai svarbu, nes anksčiau jų sprendimai buvo per brangūs Lietuvos mažam verslui. Dabar – ne.
Bet ir grėsmių daugėja. Balso klonavimas pasiekė tokį lygį, kad iš 30 sekundžių įrašo galima sukurti realistiškai skambantį tavo „dvynį”. Apie prompt injection grėsmes jau rašiau anksčiau, bet balso klonavimas yra atskira tema. Skambutis, kuris atrodo kaip iš tavo viršininko, gali būti DI sugeneruotas. Lietuvoje tokių sukčiavimo atvejų jau buvo.
KUR ELEVENLABS PRALAIMI
Vis dar yra problemų. Lietuvių kalba ElevenLabs balsai jau geri, bet ne tobuli. Kartais kirčiavimas eina ne ten. Skaitmenys ir ilgesni žodžiai vis dar suklumpa. Specializuoti terminai, ypač teisinė ar medicinos kalba – silpniau.
Kita problema – integracija. Pajungti ElevenLabs prie esamos „Microsoft Teams” ar „Salesforce” sistemos vis dar reikalauja kūrėjo. Mažam verslui be IT skyriaus tai barjeras.
Konkurentai irgi nesnaudžia. „OpenAI” turi savo balso modelį. Anthropic išleido finansų agentus, kurie taip pat naudoja balso sąsają. Kinijos kompanijos siūlo pigesnius variantus, nors kalbų pasirinkimas siauresnis.
KĄ DARYTI ŠIANDIEN
Jeigu turi mažą verslą Lietuvoje ir gauni daug skambučių, kuriuos atsako tas pats darbuotojas tomis pačiomis frazėmis – eik į elevenlabs.io ir išbandyk Conversational AI demo. Užtruksi 15 minučių. Iš tikrųjų pajusi, kaip skamba lietuviškas DI balsas atsakantis į tavo paties parašytą scenarijų.
Jeigu domiesi giliau – turiu vadovą apie DI agentų pasirinkimą, kuris padeda nuspręsti, ar tau apskritai reikia balso DI, ar geriau pradėti nuo teksto.
Po penkerių metų balso DI bus toks pat įprastas darbo įrankis kaip dabar el. paštas. Klausimas tik vienas – tu būsi tas, kuris jį valdo, ar tas, kuris liko nuošalyje.
O tu jau bandei klonuoti savo balsą? Parašyk komentaruose, kaip pavyko ar nepavyko – smalsu išgirsti tikrų pavyzdžių iš Lietuvos.

