## LG Surpreende o Mundo com IA que Domina Matemática, Ciência e Código!
A LG AI Research acaba de apresentar a EXAONE Deep, uma IA que está redefinindo os limites da resolução de problemas complexos. Prepare-se para se impressionar com sua capacidade em matemática, ciência e programação!
Criar modelos de raciocínio avançados é um desafio global, e a LG AI Research está na vanguarda dessa corrida. A EXAONE Deep chega para competir com os maiores nomes do mercado, demonstrando um nível de raciocínio que vai te deixar de queixo caído.
O foco da LG AI Research foi aprimorar drasticamente as habilidades de raciocínio da EXAONE Deep, e os resultados são impressionantes:
* **Matemática:** O modelo EXAONE Deep 32B superou um concorrente, mesmo sendo apenas 5% do seu tamanho, em um teste de matemática de alta dificuldade. As versões 7.8B e 2.4B também conquistaram o primeiro lugar em todos os principais benchmarks de matemática para seus respectivos tamanhos.
* **Ciência e Código:** Aqui, os modelos EXAONE Deep (7.8B e 2.4B) garantiram o primeiro lugar em todos os principais benchmarks.
* **MMLU (Massive Multitask Language Understanding):** O modelo 32B alcançou uma pontuação de 83.0, o melhor desempenho entre os modelos coreanos.
O reconhecimento internacional não demorou a chegar. A EXAONE Deep 32B foi incluída na lista "Notable AI Models" da organização de pesquisa americana Epoch AI, ao lado de sua antecessora, EXAONE 3.5. A LG é a única empresa coreana com modelos nesta lista nos últimos dois anos!
### Dominando a Matemática
A EXAONE Deep demonstrou habilidades excepcionais de raciocínio matemático em seus modelos 32B, 7.8B e 2.4B. Em avaliações baseadas no currículo de matemática de 2025, todos os três superaram modelos de raciocínio globais de tamanho comparável.
O modelo 32B obteve 94.5 em um teste geral de competência matemática e 90.0 no American Invitational Mathematics Examination (AIME) 2024, um exame de qualificação para a Olimpíada Matemática dos EUA. No AIME 2025, o modelo 32B igualou o desempenho do DeepSeek-R1, um modelo significativamente maior (671B).
Os modelos menores, 7.8B e 2.4B, também alcançaram as primeiras posições em benchmarks para modelos leves. O modelo 7.8B marcou 94.8 no benchmark MATH-500 e 59.6 no AIME 2025, enquanto o modelo 2.4B alcançou 92.3 e 47.9 nas mesmas avaliações.
### Excelência em Ciência e Código
A EXAONE Deep também impressionou em raciocínio científico e programação.
O modelo 32B obteve 66.1 no teste GPQA Diamond, que avalia habilidades de resolução de problemas em física, química e biologia em nível de doutorado. Na avaliação LiveCodeBench, que mede proficiência em codificação, o modelo alcançou 59.5, indicando seu potencial para aplicações de alto nível.
Os modelos 7.8B e 2.4B continuaram essa tendência, garantindo o primeiro lugar nos benchmarks GPQA Diamond e LiveCodeBench em suas categorias de tamanho.
### Conhecimento Geral Aprimorado
Além de suas habilidades especializadas, a EXAONE Deep também mostrou melhorias no entendimento de conhecimento geral.
O modelo 32B alcançou 83.0 no benchmark MMLU, posicionando-o como o modelo doméstico de melhor desempenho nesta avaliação abrangente. Isso indica que as melhorias de raciocínio da EXAONE Deep se estendem além de domínios específicos e contribuem para uma compreensão mais ampla de vários assuntos.
A LG AI Research acredita que os avanços da EXAONE Deep representam um salto em direção a um futuro onde a IA pode resolver problemas cada vez mais complexos e contribuir para enriquecer e simplificar a vida humana por meio de pesquisa e inovação contínuas.