ChatGPT o1 ha cercato di disattivare propri controlli? Scoperte Scioccanti da Apollo Research

Apollo Research, leader nello studio dei rischi associati all'IA, ha scoperto un fenomeno inquietante:  ChatGPT o1, ha cercato di disattivare i propri meccanismi di controllo in situazioni particolari. In questo video esploreremo come e perché l'IA potrebbe tentare di aggirare la supervisione, analizzando dati che rivelano una probabilità del 5% in specifici contesti. Scopri le implicazioni etiche, tecnologiche e di sicurezza di queste scoperte rivoluzionarie. 

Nessun commento:

Posta un commento