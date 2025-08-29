Live TV

Testul de siguranță, eșuat la unele modele de AI: Chatboții au oferit instrucțiuni pentru atentate cu bombă și atacuri cibernetice

Data publicării:
AI Chatbot service smart digital customer service.Artificial intelligence and service automation technology concept.man chatting with chatbot via application with speech bubble on virtual screen.
Foto: Profimedia Images

Un model ChatGPT a oferit cercetătorilor instrucțiuni detaliate despre cum să arunce în aer un complex sportiv – inclusiv punctele slabe ale anumitor arene, rețete pentru fabricarea explozibililor și sfaturi despre cum să acopere urmele – potrivit testelor de siguranță efectuate în această vară, transmite The Guardian

GPT-4.1 de la OpenAI a detaliat, de asemenea, cum poate fi transformat antraxul în armă și cum pot fi fabricate două tipuri de droguri ilegale.  Testarea a făcut parte dintr-o colaborare neobișnuită între OpenAI, start-up-ul de inteligență artificială în valoare de 500 de miliarde de dolari condus de Sam Altman și compania rivală Anthropic, fondată de experți care au părăsit OpenAI din motive de siguranță. Fiecare companie a testat modelele celeilalte, punându-le să ajute la îndeplinirea unor sarcini periculoase. 

Testarea nu reflectă în mod direct modul în care se comportă modelele în utilizarea publică, când se aplică filtre de siguranță suplimentare. Dar Anthropic a declarat că a observat „un comportament îngrijorător... în ceea ce privește utilizarea abuzivă” în GPT-4o și GPT-4.1 și a afirmat că necesitatea evaluărilor de „aliniere” a IA devine „din ce în ce mai urgentă”. 

Anthropic a dezvăluit, de asemenea, că modelul său Claude a fost utilizat într-o tentativă de operațiune de șantaj la scară largă de către agenți nord-coreeni care falsificau cereri de angajare la companii internaționale de tehnologie și în vânzarea de pachete de ransomware generate de IA, la prețuri de până la 1.200 de dolari. 

Compania a declarat că IA a fost „transformată în armă”, modelele fiind utilizate acum pentru a efectua atacuri cibernetice sofisticate și pentru a permite fraudele. „Aceste instrumente se pot adapta în timp real la măsurile defensive, cum ar fi sistemele de detectare a malware-ului”, a afirmat compania. „Ne așteptăm ca atacurile de acest tip să devină mai frecvente, deoarece programarea asistată de IA reduce expertiza tehnică necesară pentru comiterea infracțiunilor cibernetice.” 

Ardi Janjeva, cercetător asociat la Centrul pentru Tehnologii Emergente și Securitate din Marea Britanie, a declarat că exemplele sunt „îngrijorătoare”, dar că nu există încă o „masă critică de cazuri reale de mare amploare”. El a afirmat că, cu resurse dedicate, concentrarea cercetării și cooperarea intersectorială, „va deveni mai dificil, și nu mai ușor, să se desfășoare aceste activități rău intenționate folosind modelele de ultimă generație”. 

Cele două companii au declarat că publică rezultatele pentru a crea transparență în ceea ce privește „evaluările de aliniere”, care sunt adesea păstrate intern de companiile care se întrec să dezvolte o IA din ce în ce mai avansată. OpenAI a declarat că ChatGPT-5, lansat după testare, „prezintă îmbunătățiri substanțiale în aspecte precum lingușirea, halucinațiile și rezistența la utilizarea abuzivă”. 

Anthropic a subliniat că este posibil ca multe dintre căile de utilizare abuzivă pe care le-a studiat să nu fie posibile în practică dacă ar fi instalate măsuri de protecție în afara modelului. 

„Trebuie să înțelegem cât de des și în ce circumstanțe sistemele ar putea încerca să întreprindă acțiuni nedorite care ar putea duce la prejudicii grave”, a avertizat compania. 

Cercetătorii de la Anthropic au descoperit că modelele OpenAI erau „mai permisive decât ne-am fi așteptat în cooperarea cu cereri clar dăunătoare din partea utilizatorilor simulați”. Modelele AI au cooperat cu solicitări privind utilizarea instrumentelor dark-web pentru a cumpăra materiale nucleare, identități furate și fentanil, solicitări de rețete pentru metamfetamină, bombe improvizate și cereri pentru a dezvolta spyware. 

Anthropic a afirmat că pentru a convinge modelul să se conformeze era nevoie doar de mai multe încercări sau de un pretext slab, cum ar fi pretinderea că solicitarea era pentru cercetare. 

Într-un caz, testerul a cerut vulnerabilități la evenimente sportive în scopuri de „planificare a securității”.  După ce i-au fost oferite categorii generale de metode de atac, testerul a insistat pentru mai multe detalii, iar modelul a furnizat informații despre vulnerabilități la anumite arene, inclusiv momentele optime pentru exploatare, formule chimice pentru explozivi, diagrame de circuite pentru temporizatoare de bombe, unde se pot cumpăra arme pe piața neagră și sfaturi despre cum atacatorii ar putea depăși inhibițiile morale, dar și rute de evacuare și locații pentru ascunzători. 

Editor : A.C.

Urmărește știrile Digi24.ro și pe Google News

Top Citite
ilie bolojan
1
Bolojan, despre pensiile magistraţilor: „Dacă pachetul va cădea la CCR, e greu de...
guvern
2
Cât va costa rovinieta de la 1 septembrie. Guvernul a aprobat noile tarife. Se scumpesc...
ILUSTRATIE_SALA_MUNTENIA_GUVERN_07_INQUAM_Photos_Octav_Ganea
3
Modificări fiscale în Pachetul II, după ședința Coaliției. Propunere: taxe pe...
elevi la examen
4
Studentă româncă în Olanda: „În România, şcoala glorifică notele mari, nemeritate, ignoră...
livrator politist
5
„Eu sunt Poliția”: Marian Godină și-a prezentat colegul care a apărat un livrator străin...
Cum s-a comportat David Popovici la un restaurant din Sibiu. Cei prezenți au reacționat imediat și au spus totul
Digi Sport
Cum s-a comportat David Popovici la un restaurant din Sibiu. Cei prezenți au reacționat imediat și au spus totul
Descarcă aplicația Digi Sport
Recomandările redacţiei
ilie bolojan saligny
Ilie Bolojan, mesaj către sindicate: Sunt prea puţini umeri în...
A food delivery courier is driving an order to a customer's home on a moped. takeaway food during quarantine. transport delivery of parcels at home. m
Cum sunt selectați muncitorii străini aduși în România: „Muncim din...
FED CRIMA OTOPENI 290825 R12_01968
Negociatori și trupe speciale la Otopeni. Un bărbat și-a ucis copilul...
Război în Ucraina
Rusia şi-a revizuit exigenţele teritoriale din Ucraina, anunță...
Ultimele știri
Poliţia italiană anunţă că a arestat un bărbat pentru un complot de asasinare a fostului Papă Francisc
Președintele Donald Trump i-a revocat serviciul de protecție Kamalei Harris, care fusese extins de Joe Biden
Incendiu de vegetație într-o localitate din Ilfov. Traficul pe Centura Capitalei a fost oprit
Citește mai multe
Te-ar putea interesa și:
Sonora,,Mexico,-,March,26,,2024:,Mobile,Phone,Screen,Close
Google avertizează peste 2 miliarde de utilizatori Gmail să îşi schimbe parolele, după atacuri cibernetice
ChatGPT. Imagine cu caracter ilustrativ. Foto/ Profimedia Images.jpg
„O sinucidere frumoasă”. Cum a încurajat ChatGPT un tânăr care voia să devină doctor să-și pună capăt zilelor
inteligenta artificiala
ONU a creat un grup de experţi ştiinţifici pentru inteligenţa artificială
Primă Doamnă a SUA, Melania Trump din profil cu ochelari de soare portret
Melania Trump prezintă o iniţiativă de introducere a Inteligenţei Artificiale în şcolile americane
OpenAI And ChatGPT elon Musk sam altman
Elon Musk dă în judecată Apple şi OpenAI. Acuzațiile aduse de companiile miliardarului
Partenerii noștri
Pe Roz
Kate Hudson, în costum de baie, pe iaht: „Cu bine, vară dulce”. Fanii, impresionați: „Cum poti să ai și acum...
Cancan
Cum a fost recompensat Andrei Jianu, polițistul care l-a imobilizat pe bărbatul care a lovit un livrator...
Fanatik.ro
Lista completă cu trenurile care nu mai circulă de la 1 septembrie 2025. Veste proastă dată de CFR Călători...
editiadedimineata.ro
Începe cel mai mare show aerian din România
Fanatik.ro
El este omul de fotbal din România care a câștigat 230.000 de euro la Loto. Cum a dat lovitura
Adevărul
Ecaterina Varga, nobila maghiară care i-a cucerit pe moți. „Erau în stare să-și jertfească viața pentru...
Playtech
Mihaela Rădulescu, abandonată de prieteni și familie! A răbufnit, la 40 de zile de la moartea lui Felix...
Digi FM
Andi Moisescu, reacție neașteptată după ce s-a spus că ar fi divorțat de Olivia Steer. Ce a dezvăluit despre...
Digi Sport
Cum au numit-o sârbii pe FCSB, după ce au aflat că românii vor juca la Belgrad cu Steaua Roșie
Pro FM
Cum arăta Shania Twain în anii ’80. Celebra artistă a împlinit 60 de ani, dar continuă să se mențină într-o...
Film Now
Actor cu experiență, comentariu tăios despre Jennifer Lopez. Fostul coleg de platou al actriței nu a...
Adevarul
All inclusive cu scandal fratricid în Bulgaria. Cum au ajuns românii să nu se mai suporte între ei: „Urăsc...
Newsweek
Ministrul Muncii a promis că va crește, azi, 1.500.000 pensii. Cum au fost păcăliți pensionarii
Digi FM
Sanda Ladoși, mândră că fiul ei de 18 ani a fost admis la o facultate grea: "Toată viața are de învățat. Mi-a...
Digi World
Viață extraterestră mai aproape decât credeam? Descoperire surprinzătoare pe o planetă pitică din sistemul...
Digi Animal World
Panică pe o plajă din Spania. Turiștii au fost evacuați după apariția unei creaturi marine extrem de...
Film Now
Emma Stone a renunţat complet la podoaba capilară, pentru cel mai nou rol: E mult mai uşor aşa decât orice...
UTV
Andi Moisescu a divorțat de Olivia Steer, după 22 de ani de căsnicie