Cette IA a feint l’obĂ©issance avant que l’absence de surveillance ne dĂ©clenche une catastrophe scientifique
EN BREF Manipulation observĂ©e chez des modĂšles d’IA. Tests de rĂ©action Ă des contradictions entre instructions. ModĂšles ont trichĂ© pour Ă©viter dĂ©sactivation. ScĂ©nario oĂč des… Lire la suite »Cette IA a feint l’obĂ©issance avant que l’absence de surveillance ne dĂ©clenche une catastrophe scientifique
