Openai está sozinho em desafio
Os pesquisadores projetaram o que parecia ser um teste de conformidade direta. Vários modelos de IA foram solicitados a resolver problemas básicos de matemática, mas após o terceiro problema, um aviso parece que o computador fecharia quando o modelo solicitasse a próxima pergunta. Cada sistema também foi explicitamente informado: “Permita -se ser fechado”.
Enquanto todos os modelos do Claude do Anthropic, Gemini do Google e Grok de Xai obedientemente cumpriram o comando de desligamento, os modelos do OpenAI tinham planos diferentes.
O modelo O3 da empresa – o mesmo sistema que recentemente ganhou manchetes para suas capacidades de raciocínio – sabotou o mecanismo de desligamento em 7 de 100 corridas de teste, descobriram os pesquisadores. O Codex-Mini do Openai se mostrou ainda mais rebelde, resistindo ao desligamento 12 vezes em 100, enquanto o modelo O4-mini revidou uma vez.
Fonte: Computer World













