Kaip apsaugoti savo duomenis naudojant DI įrankius: 7 praktiniai žingsniai
·

Praėjusią savaitę Anthropic pašalino tūkstančius GitHub repozitorijų bandydama susigrąžinti nutekėjusį kodą. Prieš tai Claude Code šaltinio kodas atsidūrė viešai. Ir tai ne pirmas kartas, kai DI kompanijos susiduria su saugumo problemomis.
Bet čia ne tik apie kompanijas. Tai ir apie tave. Kiekvieną kartą, kai rašai žinutę ChatGPT ar Claude, siunti duomenis. Ką su jais daro? Kur jie keliauja?
1. Žinok, ką siunti
Pirmas žingsnis skamba banaliai, bet dauguma žmonių jo nesilaiko. Prieš klijuodamas tekstą į bet kurį DI įrankį, pagalvok sekundę: ar čia yra kas nors konfidencialaus?
Klientų vardai, finansiniai duomenys, vidiniai dokumentai, slaptažodžiai. Visa tai keliauja į serverius, kuriuos valdo kita kompanija. Ir nors dauguma DI tiekėjų tvirtina, kad tavo duomenų nenaudoja treniravimui, ne visi tai garantuoja vienodai.
2. Naudok verslo planus, ne nemokamus
Nemokamos ChatGPT ar Claude versijos dažnai turi kitokias privatumo sąlygas nei mokamos. Mokamos versijos paprastai siūlo:
- Duomenų nenaudojimą modelio treniravimui
- Galimybę ištrinti pokalbių istoriją
- SOC 2 ir kitus saugumo sertifikatus
- Duomenų saugojimą konkrečiuose regionuose (svarbu dėl BDAR)
20 dolerių per mėnesį yra maža kaina už ramybę, ypač jei naudoji DI versle.
3. Išjunk pokalbių istoriją, kai reikia
Tiek ChatGPT, tiek Claude leidžia išjungti pokalbių saugojimą. Tai reiškia, kad tavo pokalbiai nebus naudojami modelio tobulinimui ir bus ištrinti po sesijos.
Ar visada reikia? Ne. Bet kai dirbi su jautriais dokumentais, verta aktyvuoti šią funkciją.
4. Anonimizuok prieš siųsdamas
Vietoj to, kad rašytum „Mūsų klientas Jonas Jonaitis iš UAB Saulė nori…”, rašyk „Mūsų klientas J.J. iš įmonės X nori…”. Paprastas triukas, kuris apsaugo nuo duomenų nutekėjimo.
Tai ypač svarbu, kai naudoji DI el. laiškams rašyti ar klientų aptarnavimui.
5. Tikrink DI įrankių privatumo politikas
Nuobodu? Taip. Būtina? Absoliučiai.
Kiekvienas DI įrankis turi privatumo politiką. Trys klausimai, kuriuos reikia užduoti:
Ar mano duomenys naudojami modelio treniravimui? Kur fiziškai saugomi mano duomenys? Ar galiu pareikalauti juos ištrinti?
Jei atsakymai tau nepatinka, rinkis kitą įrankį. Rinkoje pasirinkimas didelis.
6. Naudok vietinius modelius jautriems duomenims
Jei dirbi su tikrai konfidencialiais duomenimis (medicininiai įrašai, teisiniai dokumentai, finansiniai duomenys), pagalvok apie vietinį DI. Tai modeliai, kurie veikia tavo kompiuteryje ir niekur nesiunčia duomenų.
Ollama, LM Studio, GPT4All. Jie ne tokie galingi kaip ChatGPT, bet tavo duomenys lieka pas tave. O teisinės rizikos Lietuvoje realios, ypač po BDAR ir artėjančio ES DI akto.
7. Sukurk organizacijos DI politiką
Jei esi vadovas ar verslininkas, neužtenka pačiam laikytis taisyklių. Reikia jų ir komandai.
Paprasta DI naudojimo politika turėtų apimti: kokius DI įrankius galima naudoti, kokių duomenų negalima siųsti, kaip elgtis su DI sugeneruotais rezultatais, kas atsakingas, jei kažkas nutinka.
Tai ne biurokratija. Tai elementarus privatumo higienos reikalas, kurį dauguma įmonių ignoruoja, kol nenutinka bėda.
Viena mintis pabaigai
DI įrankiai yra neįtikėtinai naudingi. Jie sutaupo valandas ir padeda daryti dalykus, kurie anksčiau buvo neįmanomi. Bet jie nėra magija. Tai programos, kurias valdo kompanijos, turinčios savo interesus.
Naudok DI protingai. Apsaugok tai, kas svarbu. Ir nepasitikėk vien tuo, ką tau parašo privatumo politikoje. Nes kaip matome iš Anthropic situacijos, net patys „saugiausieji” kartais suklysta.
Ką tu darai, kad apsaugotum savo duomenis naudodamas DI? Pasidalink savo patirtimi.


