## Amazon Apresenta Nova Act: A Inteligência Artificial que Revolucionará a Automação na Web
A Amazon acaba de lançar a Nova Act, um modelo de IA de última geração projetado para criar agentes mais inteligentes e capazes de executar tarefas complexas diretamente nos navegadores web. Prepare-se para uma nova era de automação!
Enquanto os modelos de linguagem tradicionais popularizaram os "agentes" como ferramentas para responder perguntas ou buscar informações, a Amazon eleva o conceito a um novo patamar. A visão da empresa é que os agentes não sejam apenas respondedores, mas entidades capazes de realizar tarefas concretas e multifacetadas em diversos ambientes digitais e físicos.
Imagine agentes que organizam um casamento inteiro ou gerenciam tarefas complexas de TI, impulsionando a produtividade das empresas. Esse é o futuro que a Amazon está construindo.
As soluções atuais do mercado frequentemente deixam a desejar, exigindo supervisão humana constante e dependendo de integrações de API abrangentes, o que nem sempre é viável. A Nova Act surge como a resposta da Amazon a essas limitações.
### SDK para Desenvolvedores: Criando Agentes Inteligentes
Juntamente com o modelo, a Amazon está lançando uma versão de pesquisa do SDK (Software Development Kit) da Amazon Nova Act. Com ele, os desenvolvedores podem criar agentes capazes de automatizar tarefas web como:
* Enviar notificações de ausência do escritório
* Agendar compromissos na agenda
* Ativar respostas automáticas de e-mail
O SDK foi projetado para decompor fluxos de trabalho complexos em "comandos atômicos" confiáveis, como pesquisar, finalizar a compra ou interagir com elementos específicos da interface, como menus suspensos e pop-ups. Os desenvolvedores podem adicionar instruções detalhadas para refinar esses comandos, por exemplo, instruindo um agente a ignorar uma oferta de seguro durante a finalização de uma compra.
Para aumentar ainda mais a precisão, o SDK oferece suporte à manipulação do navegador via Playwright, chamadas de API, integrações Python e threading paralelo para superar atrasos no carregamento de páginas web.
### Desempenho Excepcional em Testes de Referência
Ao contrário de outros modelos generativos que apresentam precisão mediana em tarefas complexas, a Nova Act prioriza a confiabilidade. A Amazon destaca as pontuações impressionantes do modelo, superiores a 90% em avaliações internas de recursos específicos que normalmente desafiam os concorrentes.
A Nova Act alcançou uma pontuação quase perfeita de 0,939 no benchmark ScreenSpot Web Text, que mede a capacidade de seguir instruções em linguagem natural para interações baseadas em texto, como ajustar o tamanho da fonte. Modelos concorrentes como o Claude 3.7 Sonnet (0,900) e o CUA da OpenAI (0,883) ficam significativamente para trás.
Da mesma forma, a Nova Act obteve 0,879 no benchmark ScreenSpot Web Icon, que testa interações com elementos visuais como estrelas de classificação ou ícones. No teste GroundUI Web, projetado para avaliar a proficiência de uma IA na navegação em vários elementos da interface do usuário, a Nova Act ficou ligeiramente atrás dos concorrentes, mas a Amazon vê isso como uma área com grande potencial de melhoria à medida que o modelo evolui.
A Amazon enfatiza seu foco em oferecer confiabilidade prática. Depois que um agente construído com a Nova Act funcionar como esperado, os desenvolvedores podem implantá-lo de forma autônoma, integrá-lo como uma API ou até mesmo agendá-lo para executar tarefas de forma assíncrona. Em um caso de uso demonstrado, um agente pede automaticamente uma salada para entrega toda terça-feira à noite, sem exigir intervenção contínua do usuário.
### A Visão da Amazon para Agentes de IA Inteligentes e Escaláveis
Um dos recursos de destaque da Nova Act é sua capacidade de transferir sua compreensão da interface do usuário para novos ambientes com o mínimo de treinamento adicional. A Amazon compartilhou um exemplo em que a Nova Act teve um desempenho admirável em jogos baseados em navegador, mesmo que seu treinamento não incluísse experiências de videogame. Essa adaptabilidade posiciona a Nova Act como um agente versátil para diversas aplicações.
Essa capacidade já está sendo aproveitada no ecossistema da Amazon. Dentro do Alexa+, a Nova Act permite a navegação web autodirigida para concluir tarefas para os usuários, mesmo quando o acesso à API não é abrangente o suficiente. Isso representa um passo em direção a assistentes de IA mais inteligentes que podem funcionar de forma independente, aproveitando suas habilidades de maneiras mais dinâmicas.
A Amazon deixa claro que a Nova Act representa o primeiro estágio em uma missão mais ampla para criar agentes de IA inteligentes e confiáveis, capazes de lidar com tarefas cada vez mais complexas e multifacetadas.
Em vez de se limitar a instruções simples, o foco da Amazon é treinar agentes por meio de aprendizado por reforço em cenários variados do mundo real, em vez de demonstrações excessivamente simplistas. Este modelo fundamental serve como um ponto de verificação em um currículo de treinamento de longo prazo para os modelos Nova, indicando a ambição da empresa de remodelar o cenário de agentes de IA.
"Os casos de uso mais valiosos para agentes ainda não foram construídos", observou a Amazon. "Os melhores desenvolvedores e designers os descobrirão. Esta versão de pesquisa do nosso SDK Nova Act nos permite iterar junto com esses construtores por meio de prototipagem rápida e feedback iterativo."
A Nova Act é um passo em direção a tornar os agentes de IA verdadeiramente úteis para tarefas digitais complexas. Desde a reformulação de benchmarks até a ênfase na confiabilidade, sua filosofia de design está centrada em capacitar os desenvolvedores a ir além do que é possível com as ferramentas da geração atual.