Rezumatele generate de IA de la Google oferă „milioane de răspunsuri eronate” în fiecare oră. Care e poziția companiei

Data actualizării: Data publicării:
IA
Foto: Profimedia

Un experiment cu funcția AI Overviews din motorul de căutare Google a arătat că inteligența artificială oferă răspunsuri corecte doar în 90% din cazuri. Totuși, o nuanță esențială constă în faptul că cel puțin 1 din 10 răspunsuri este fals. Având în vedere numărul de căutări, se poate vorbi de milioane de „răspunsuri false” pe oră, se menționează într-un studi realizat de The New York Times și startup-ul Oumi.

AI Overviews este o funcție a motorului de căutare Google care utilizează inteligența artificială (Gemini) pentru a genera răspunsuri automate și concise la solicitările utilizatorilor. A fost lansată pentru prima dată în 2024, iar anul trecut, începând din luna mai, a cunoscut o largă răspândire.

De la momentul implementării, Google AI Overviews a stârnit o mulțime de controverse și plângeri, dar, în timp și odată cu lansarea noilor modele Gemini, a devenit mai bună. Într-un nou experiment, The New York Times a încercat să evalueze acuratețea răspunsurilor AI în acest moment: s-a dovedit că acestea sunt corecte în 90% din cazuri, adică cel puțin 1 din 10 răspunsuri este eronat.

Experimentul a fost realizat în colaborare cu startup-ul de IA Oumi, iar pentru verificarea răspunsurilor s-a folosit SimpleQA – un test standard pentru modele, cu 4.000 de întrebări, creat de OpenAI în 2024. Primele teste au fost efectuate de Oumi anul trecut, când era actuală modelul Gemini 2.5. – atunci precizia AI Overviews era de 85%.

După actualizarea la Gemini 3, aceasta a crescut la 91%. În același timp, dacă extrapolăm nivelul de erori la toate căutările, se poate vorbi despre milioane de răspunsuri eronate pe oră și sute de mii pe minut.

Așa cum era de așteptat, Google a criticat metodologia studiului. Purtătorul de cuvânt Ned Adrians a declarat că SimpleQA poate conține inexactități. În schimb, compania folosește propriul text SimpleQA Verified, care se bazează pe un eșantion mai mic, dar verificat mai atent.

„Acest studiu are lacune serioase”, a declarat Adrians pentru NYT. „Nu reflectă ceea ce caută oamenii cu adevărat pe Google”.

Evaluarea IA rămâne o sarcină dificilă. Fiecare companie are propria modalitate de a demonstra capacitățile, deși verificarea este complicată și de faptul că modelele pot oferi răspunsuri diferite la aceeași întrebare.

O altă particularitate este că AI Overviews nu este singurul model. Google a anunțat într-un comentariu pentru Ars Technica că sistemul alege „cel mai relevant” răspuns pentru fiecare interogare. Cele mai precise răspunsuri ar putea fi furnizate de Gemini 3.1 Pro, dar acesta este lent și costisitor, așa că se utilizează mai des modelele Gemini Flash.

În ciuda tuturor acestor aspecte, un indicator de acuratețe de 9 din 10 pentru IA reprezintă un rezultat destul de bun pentru industrie. Anterior, Google a publicat teste ale noilor modele cu o precizie de 60–80% fără acces la date externe. Utilizarea surselor de pe internet îmbunătățește rezultatul, dar creează în același timp o altă problemă: utilizatorii au încredere în IA și nu verifică informațiile la sursele originale.

Deși Google susține că rezultatele experimentului NYT nu corespund realității compania continuă să menționeze la sfârșitul fiecărui răspuns: „IA poate greși, așa că verificați încă o dată”.

Editor : Sebastian Eduard

Urmărește știrile Digi24.ro și pe Google News

Partenerii noștri
Playtech
De ce nu poate România să doboare toate dronele rusești care îi încalcă spațiul aerian. Ce sisteme de apărare...
Digi FM
Cum a încercat un bărbat să ascundă uciderea iubitei însărcinate. S-a eschivat ani întregi
Descarcă aplicația Digi FM
Pro FM
Val de reacții după ce Bianca Censori a apărut într-o nouă ținută provocatoare. Topul nu i-a acoperit bustul...
Film Now
Toți au vorbit despre J.LO la premiera noului ei film. Detaliul care a declanșat zvonuri despre operații...
Adevarul
Haos în lanțul de comandă. Cine răspunde pentru securitatea Portului Constanța în caz de criză?
Newsweek
Ajutor la pensie de la Înalta Curte. Avocat: Cresc șansele ca pensionarii să ia bani în plus în instanță
Digi FM
Solistul de la Imagine Dragons și iubita sa au strălucit la prima apariție oficială de când formează un...
Descarcă aplicația Digi FM
Digi World
Ce se întâmplă cu creierul tău când stai pe telefon până târziu în noapte. Medicii avertizează asupra unui...
Digi Animal World
Ce a găsit un bărbat când se pregătea să-și spele rufele: „Era în haine, am rămas traumatizat”
Film Now
Quentin Tarantino atacă Hollywood-ul și dezvăluie singurul film care l-a impresionat în ultimii șase ani...
UTV
Jennifer Lopez a întors toate privirile la premiera filmului „Office Romance”. Artista a apărut alături de...