A OpenAI lançou um novo framework e uma suíte de avaliações voltados à monitorabilidade do chain-of-thought (cadeia de raciocínio), abrangendo 13 testes aplicados em 24 ambientes distintos.
Segundo a organização, os resultados indicam que observar o raciocínio interno dos modelos é muito mais eficaz do que vigiar apenas as respostas finais. Essa abordagem, de acordo com a OpenAI, aponta para um caminho promissor de controle escalável à medida que sistemas de IA se tornam mais capazes.