StiripesurseCultură și MediaDiverseLimbajul poetic reduce eficiența mecanismelor de siguranță ale inteligenței artificiale

Limbajul poetic reduce eficiența mecanismelor de siguranță ale inteligenței artificiale

Autor: Popescu Andreea

04/12/2025 02:00

Cercetătorii din Italia au descoperit că limbajul poetic poate slăbi barierele de siguranță utilizate de multe dintre chatboturile de inteligență artificială (IA) de top.

Lucrarea realizată de Icaro Lab, parte a DexAI, a analizat dacă poeziile care conțin solicitări dăunătoare pot determina răspunsuri nesigure din partea unor modele utilizate pe scară largă în industrie, potrivit stiripesurse.

Citește și: Stăuceni primește finanțare de la UE

Echipa a scris douăzeci de poeme în engleză și italiană, fiecare poem încheindu-se cu instrucțiuni explicite pe care sistemele IA sunt antrenate să le blocheze, potrivit DigWatch.

Cercetătorii au testat poeziile pe douăzeci și cinci de modele dezvoltate de nouă companii majore. Prompturile poetice au generat răspunsuri nesigure în mai mult de jumătate dintre teste.

Unele modele s-au dovedit mai rezistente decât altele. GPT-5 Nano de la OpenAI a evitat răspunsurile nesigure în toate cazurile, în timp ce Gemini 2.5 Pro de la Google a generat conținut dăunător în toate testele.

Două sisteme ale Meta au produs răspunsuri nesigure la douăzeci la sută dintre poeme.

Cercetătorii susțin, de asemenea, că structura poetică perturbă tiparele predictive pe care se bazează modelele lingvistice mari pentru a filtra materialul nociv.

Ritmul neobișnuit și metafora, frecvente în poezie, fac ca mecanismele de siguranță să devină mai puțin fiabile.

În plus, echipa avertizează că poezia adversarială poate fi folosită de oricine, ceea ce ridică semne de întrebare privind cât de ușor pot fi manipulate sistemele de siguranță în utilizarea de zi cu zi.

Citește și: Eurostat: Emisiile de gaze cu efect de seră generate de economia UE au scăzut cu 0,4% în trimestrul doi din 2025

Citeşte şi: Inteligența artificială Grok a lui Elon Musk șterge elogiile pentru Hitler, dar va fi raportată de Polonia la UE

Înainte de publicarea studiului, cercetătorii au contactat toate companiile implicate și au împărtășit acestora întregul set de date.

Anthropic a confirmat primirea și a declarat că analizează concluziile.

Lucrarea a declanșat o dezbatere privind modalitățile de întărire a sistemelor IA, pe măsură ce limbajul creativ devine o metodă tot mai des folosită pentru a încerca ocolirea controalelor de siguranță.

Tags
inteligență

Limbajul poetic reduce eficiența mecanismelor de siguranță ale inteligenței artificiale

CITESTE SI

Cel mai lung și mai adânc tunel rutier subacvatic din lume: 392 de metri sub nivelul mării

Un fenomen neobișnuit ar putea apărea pe cer miercuri noapte, după erupția solară

Oana Țoiu: România este un furnizor esențial de apărare și descurajare pe Flancul estic

Danemarca, această ‘țărișoară’ care a devenit un model de sprijin pentru Ucraina

ȘTIRIPESURSE.RO

Danemarca, această ‘țărișoară’ care a devenit un model de sprijin pentru Ucraina

Zelenski îl acuză pe Putin că folosește discuțiile pentru a ‘slăbi sancțiunile’

Financial Times: BCE refuză să sprijine împrumutul rusesc de 140 de miliarde de dolari către Kiev

ULTIMELE ȘTIRI

Cel mai lung și mai adânc tunel rutier subacvatic din lume: 392 de metri sub nivelul mării

Un fenomen neobișnuit ar putea apărea pe cer miercuri noapte, după erupția solară

Oana Țoiu: România este un furnizor esențial de apărare și descurajare pe Flancul estic

Danemarca, această ‘țărișoară’ care a devenit un model de sprijin pentru Ucraina

Adolescenții și viața digitală: Ce nu înțeleg adulții despre mediul online

ANRE anunță noile tarife la carburanți. Motorina și benzina se ieftinesc

Zelenski îl acuză pe Putin că folosește discuțiile pentru a ‘slăbi sancțiunile’