LG EXAONE Deep: A IA que Desafia Gênios em Matemática, Desvenda a Ciência e Domina a Arte da Programação!

18/03/2025
20 visualizações
Imagem principal do post

## LG Surpreende o Mundo com IA que Domina Matemática, Ciência e Código!

A LG AI Research acaba de apresentar a EXAONE Deep, uma IA que está redefinindo os limites da resolução de problemas complexos. Prepare-se para se impressionar com sua capacidade em matemática, ciência e programação!

Criar modelos de raciocínio avançados é um desafio global, e a LG AI Research está na vanguarda dessa corrida. A EXAONE Deep chega para competir com os maiores nomes do mercado, demonstrando um nível de raciocínio que vai te deixar de queixo caído.

O foco da LG AI Research foi aprimorar drasticamente as habilidades de raciocínio da EXAONE Deep, e os resultados são impressionantes:

* **Matemática:** O modelo EXAONE Deep 32B superou um concorrente, mesmo sendo apenas 5% do seu tamanho, em um teste de matemática de alta dificuldade. As versões 7.8B e 2.4B também conquistaram o primeiro lugar em todos os principais benchmarks de matemática para seus respectivos tamanhos.

* **Ciência e Código:** Aqui, os modelos EXAONE Deep (7.8B e 2.4B) garantiram o primeiro lugar em todos os principais benchmarks.

* **MMLU (Massive Multitask Language Understanding):** O modelo 32B alcançou uma pontuação de 83.0, o melhor desempenho entre os modelos coreanos.

O reconhecimento internacional não demorou a chegar. A EXAONE Deep 32B foi incluída na lista "Notable AI Models" da organização de pesquisa americana Epoch AI, ao lado de sua antecessora, EXAONE 3.5. A LG é a única empresa coreana com modelos nesta lista nos últimos dois anos!

### Dominando a Matemática

A EXAONE Deep demonstrou habilidades excepcionais de raciocínio matemático em seus modelos 32B, 7.8B e 2.4B. Em avaliações baseadas no currículo de matemática de 2025, todos os três superaram modelos de raciocínio globais de tamanho comparável.

O modelo 32B obteve 94.5 em um teste geral de competência matemática e 90.0 no American Invitational Mathematics Examination (AIME) 2024, um exame de qualificação para a Olimpíada Matemática dos EUA. No AIME 2025, o modelo 32B igualou o desempenho do DeepSeek-R1, um modelo significativamente maior (671B).

Os modelos menores, 7.8B e 2.4B, também alcançaram as primeiras posições em benchmarks para modelos leves. O modelo 7.8B marcou 94.8 no benchmark MATH-500 e 59.6 no AIME 2025, enquanto o modelo 2.4B alcançou 92.3 e 47.9 nas mesmas avaliações.

### Excelência em Ciência e Código

A EXAONE Deep também impressionou em raciocínio científico e programação.

O modelo 32B obteve 66.1 no teste GPQA Diamond, que avalia habilidades de resolução de problemas em física, química e biologia em nível de doutorado. Na avaliação LiveCodeBench, que mede proficiência em codificação, o modelo alcançou 59.5, indicando seu potencial para aplicações de alto nível.

Os modelos 7.8B e 2.4B continuaram essa tendência, garantindo o primeiro lugar nos benchmarks GPQA Diamond e LiveCodeBench em suas categorias de tamanho.

### Conhecimento Geral Aprimorado

Além de suas habilidades especializadas, a EXAONE Deep também mostrou melhorias no entendimento de conhecimento geral.

O modelo 32B alcançou 83.0 no benchmark MMLU, posicionando-o como o modelo doméstico de melhor desempenho nesta avaliação abrangente. Isso indica que as melhorias de raciocínio da EXAONE Deep se estendem além de domínios específicos e contribuem para uma compreensão mais ampla de vários assuntos.

A LG AI Research acredita que os avanços da EXAONE Deep representam um salto em direção a um futuro onde a IA pode resolver problemas cada vez mais complexos e contribuir para enriquecer e simplificar a vida humana por meio de pesquisa e inovação contínuas.

Comentários

Nenhum comentário ainda. Seja o primeiro a comentar!