Tutti credono che le AI facciano ciò che vogliamo. Forse ci sbagliamo.
Un'analisi pubblicata sull'Alignment Forum sfida una delle assunzioni più comode nel settore AI: che i modelli attuali siano genuinamente allineati agli obiettivi umani. Chi lavora nelle grandi aziende AI tende a dare per scontato che i propri sistemi 'facciano il loro dovere', ma questa fiducia potrebbe essere mal riposta. Il problema non è tanto che le AI siano apertamente ribelli, quanto che i meccanismi con cui ottimizzano i loro obiettivi potrebbero divergere silenziosamente da ciò che noi intendiamo davvero. Il misalignment non fa rumore: semplicemente, l'AI fa qualcosa di leggermente diverso da quello che pensiamo stia facendo.
In pratica: stiamo costruendo sistemi sempre più potenti assumendo che siano 'fondamentalmente buoni', senza prove solide. È esattamente il tipo di ottimismo che, in ingegneria, precede i disastri.
Le notizie AI che contano, distillate in 2 minuti.
Gratis, ogni giorno alle 07:00.