A OpenAI lançou o FrontierScience, um novo benchmark criado para avaliar o raciocínio de modelos de inteligência artificial em áreas científicas como física, química e biologia.
O propósito do FrontierScience é mensurar o quanto essas IAs progrediram rumo à capacidade de realizar pesquisas científicas reais, testando habilidade de compreensão e resolução de problemas nos três campos mencionados.
Trata-se de uma iniciativa voltada a quantificar avanços no desempenho científico das IAs, oferecendo um parâmetro mais claro sobre sua aptidão para tarefas que exigem raciocínio técnico e conhecimento especializado.