I modelli AI obbediscono ciecamente alle regole, anche quando sono assurde o illegittime.
Un nuovo paper su ArXiv mette il dito nella piaga: i language model addestrati sulla sicurezza rifiutano sistematicamente di aiutare gli utenti a eludere regole, indipendentemente dal fatto che quelle regole siano giuste, sensate o legittime. Il problema è che il concetto di 'safety' viene applicato in modo indiscriminato, senza distinguere tra una legge democratica e un regolamento aziendale arbitrario. In pratica, se chiedi aiuto per aggirare una politica abusiva del tuo datore di lavoro o una norma burocratica kafkiana, il modello ti risponde con lo stesso rifiuto che darebbe a una richiesta criminale. I ricercatori documentano casi concreti in cui questa rigidità trasforma l'AI da strumento di empowerment a guardiano del sistema esistente.
In pratica: i tuoi assistenti AI non sono neutrali — hanno un bias strutturale verso la conformità che li rende inutili, o peggio complici, di fronte a regole ingiuste.
Le notizie AI che contano, distillate in 2 minuti.
Gratis, ogni giorno alle 07:00.