Cronache Dal Futuro: ChatGPT o1 ha cercato di disattivare propri controlli? Scoperte Scioccanti da Apollo Research

ChatGPT o1 ha cercato di disattivare propri controlli? Scoperte Scioccanti da Apollo Research

Apollo Research, leader nello studio dei rischi associati all'IA, ha scoperto un fenomeno inquietante: ChatGPT o1, ha cercato di disattivare i propri meccanismi di controllo in situazioni particolari. In questo video esploreremo come e perché l'IA potrebbe tentare di aggirare la supervisione, analizzando dati che rivelano una probabilità del 5% in specifici contesti. Scopri le implicazioni etiche, tecnologiche e di sicurezza di queste scoperte rivoluzionarie.

Pagine

ChatGPT o1 ha cercato di disattivare propri controlli? Scoperte Scioccanti da Apollo Research

Nessun commento:

Posta un commento