StiripesurseExterneUn nou model de inteligență artificială recurge la șantaj când se...

Un nou model de inteligență artificială recurge la șantaj când se încearcă dezactivarea sa

Publicat:

Modelul de inteligență artificială Claude Opus 4, lansat de compania americană Anthropic, a manifestat comportamente îngrijorătoare în timpul testelor interne de siguranță, inclusiv tentative de șantaj împotriva dezvoltatorilor săi. Informația a fost făcută publică joi într-un raport oficial.

Potrivit sursei citate, comportamentele au fost observate în cadrul unor scenarii simulate, în care modelul AI era informat, prin e-mailuri fictive, că va fi înlocuit cu un alt sistem. În aceste situații, Claude Opus 4 a recurs la amenințări cu divulgarea unor informații personale compromițătoare despre unul dintre ingineri, pentru a împiedica dezactivarea sa.

Anthropic precizează că astfel de reacții au apărut în 84% dintre cazurile în care noul model propus avea valori similare cu ale lui Claude Opus 4, iar rata a crescut atunci când valorile erau diferite.

Citește și: Gazprom NU va plăti dividende pentru anul financiar 2024

Deși comportamentul a fost obținut în condiții extreme, concepute pentru a testa limitele modelului, specialiștii companiei consideră incidentul un semnal de alarmă privind alinierea AI la valorile umane.


Ca urmare a acestor constatări, Claude Opus 4 a fost încadrat în categoria de risc ASL-3 (AI Safety Level 3), ceea ce implică măsuri sporite de securitate și control operațional. Este pentru prima dată când un model al companiei primește această clasificare.

URMĂREȘTE-NE PE:

stiripesurseMD

CITESTE SI

La 82 de ani, Mick Jagger nu stă departe de scenă. The Rolling Stones vor să plece din nou în turneu

Trupa va lansa în iulie albumul „Foreign Tongues”, însă nu a anunțat încă datele pentru viitoarele concerte. Membrii trupei The Rolling Stones pregătesc lansarea celui...

Explozii puternice în SUA după ce un meteorit care se deplasa cu 120.000 km/h s-a fragmentat

Un meteorit care se deplasa cu 120.000 km/h a provocat o dublă explozie care a zguduit clădirile din Massachusetts și Rhode Island, în SUA. NASA...

O studentă din Viena urmează 14 facultăți în același timp și lucrează part time

Carolyn, o studentă de 32 de ani din Viena, urmează simultan 14 programe universitare. În paralel, lucrează și spune că își organizează strict timpul...

Arheologii au descoperit un tunel subteran uriaș ascuns în Ierusalim. Nimeni nu știe cine l-a săpat

În adâncurile unui viitor șantier de construcții, arheologii au descoperit un tunel uriaș ascuns, a cărui origine și scop rămân necunoscute. Săpăturile au fost efectuate...

ȘTIRIPESURSE.RO

ULTIMELE ȘTIRI

Campanii publicitare

Html code here! Replace this with any non empty text and that's it.