
Google își poate antrena serviciile AI din căutări web, chiar dacă publicațiile resping partajarea datelor
Google poate să-și antreneze serviciile de inteligență artificială pe baza conținutul de pe web, chiar dacă editorii sau publicațiile aleg să nu facă parte din colectarea acestor date de antrenare a produselor AI.
Dezvăluirea a fost făcută de vicepreședintele DeepMind, departamentului de dezvoltare AI din cadrul Google, în timpul unei declarații din procesul antitrust al Departamentului de Justiție din SUA. Motivul care permite companiei Big Tech să ignore cerințele de opt-out, cum sunt cunoscute, este că acestea sunt făcute să acopere doar serviciile oferite de DeepMind.
Oricare alt produs AI al Google este liber să folosească conținutul de pe web, deși utilizatorilor și publicațiilor li se crează altă impresie prin semnarea formularelor opt-out. Concret, asta ajută cel mai mult programul de inteligență artificială pe care Google îl folosește în cadrul Google Search – adică fix serviciul de bază al companiei, căutările pe web.
Conform Bloomberg, procurorii DOJ au presat această problemă și au reușit să-l facă pe vicepreședintele DeepMind să admită că programul AI din Google Search nu este afectat de dorința publicațiilor de a renunța la partajarea conținutului lor. Soluția pentru a scăpa este de a cere Google ca site-ul tău să nu fie indexat deloc în căutări.
Practicile subtile ale Big Tech
Google, la fel ca restul marilor companii de tech, aplică o gamă largă de practici subtile care păcălesc utilizatorii sau legea și manipulează cum anume interacțiunea cu platformele sale e mereu în folosul general al companiei.
Aceste practici, în teorie sunt reglementate, de asta în UE programul AI din Google Search nu este încă disponibil în toate țările, însă și aici, pare că va fi doar o chestiune de timp. Google este una dintre cele mai mari companii din lume, iar faptul că așa-zisa soluție pentru a scăpa de partajarea datelor pentru antrenarea AI este să renunți la indaxarea de pe Search cu totul, nu este o alegere reală.
În timpul procesului din SUA, procurorii DOJ au prezentat și un document care arată că Google a eliminat 80 de miliarde din cele 160 de miliarde de „token-uri” (date luate din conținutul de pe web) după ce a filtrat materialul pe care publicațiile au optat să nu-l permită să fie folosit de Google.
Cu alte cuvinte, baza de date a Google se dublează prin aceste practici subtile, care ignoră dorința utilizatorilor și a publicațiilor.
Procesul antitrust demarat de autoritățile americane în urmă cu doi ani caută să rezolve monopolul pe căutări al Google și vizează, în principal, Chrome. Browserul este în centrul discuției pentru că este principalul mijloc prin care utilizatorii folosesc motorul de căutare al Google, iar datele colectate de Chrome sunt folosite mai apoi pentru serviciile de publicitate – locul de unde vin majoritatea banilor Google.
Articole asemănătoare
Comisia Europeană va examina ancheta fiscală a Italiei împotriva Meta
Cum vrea Google să schimbe modul în care căutăm informații pe internet
Apple ar putea lansa un MacBook Pro pentru #saraki
Jurnalistul Christo Grozev a părăsit Austria din cauza amenințărilor serviciilor secrete ruse
Facebook ia în calcul o schimbare majoră la una din aplicațiile de mesagerie