Um relatório da Veracode revelou que quase metade do código produzido por assistentes de inteligência artificial contém vulnerabilidades de segurança, mesmo quando aparenta estar funcional e pronto para uso em produção. O estudo GenAI Code Security 2025 testou mais de cem modelos de linguagem em 80 tarefas de codificação e constatou que 45% das amostras falharam em testes de segurança, apresentando problemas enquadrados em categorias clássicas do OWASP Top 10, uma lista de referência mundial para as principais falhas de segurança em aplicações web. Os dados colocam em xeque a confiança que equipes de desenvolvimento vêm depositando em ferramentas de geração de código baseada em IA.
O cenário é ainda mais preocupante quando se analisa linguagens específicas. Em Java, a linguagem mais utilizada em ambientes corporativos, a taxa de falha atingiu 72%. Esses números ganham relevância diante da velocidade com que a adoção dessas ferramentas avança. Pesquisa da GitHub com 500 respondentes em empresas de grande porte no Brasil, publicada em 2024, indicou que mais de 97% dos desenvolvedores já utilizam assistentes de IA no trabalho, percentual equivalente ao observado em economias como Estados Unidos, Alemanha e Índia. O Gartner, por sua vez, projeta que 75% dos engenheiros de software em grandes empresas utilizarão esses assistentes até 2028.
A raiz do problema está na natureza dos modelos de linguagem. Esses sistemas não compreendem segurança no sentido técnico. Eles operam por probabilidade estatística, reproduzindo padrões presentes nos dados de treinamento, que incluem tanto boas práticas quanto implementações vulneráveis. O resultado tende a refletir essa ambiguidade, gerando código que funciona, mas que carrega falhas difíceis de detectar à primeira vista.
Uma pesquisa da Stanford University, publicada nos anais da ACM CCS, uma das principais conferências de segurança da informação do mundo, acrescentou uma camada de complexidade ao debate. O estudo demonstrou que desenvolvedores que usam assistentes de IA não apenas produzem código menos seguro, mas também declararam acreditar na segurança do que geraram. A combinação entre código vulnerável e falsa confiança cria um cenário propício à acumulação de riscos silenciosos nas aplicações.
Na prática, o que se observa é a ampliação de falhas já conhecidas, agora em escala acelerada. Entre as mais recorrentes estão problemas de injeção de comandos, uso inadequado de consultas a bancos de dados, validação insuficiente de entradas e construção insegura de chamadas a APIs, interfaces que permitem a comunicação entre diferentes sistemas de software. Em muitos casos, o modelo sugere soluções que parecem seguir padrões estabelecidos, mas ignoram nuances de contexto, como a origem dos dados, limites de confiança ou regras específicas de negócio.
Falhas de autenticação e autorização também aparecem com frequência nos resultados gerados por IA. Fluxos produzidos automaticamente tendem a simplificar processos, omitindo validações intermediárias ou adotando permissões mais amplas do que o necessário. Em ambientes corporativos, esse tipo de simplificação pode abrir acesso indevido a dados sensíveis ou a funções administrativas críticas.
Outro vetor de risco identificado é o uso de dependências externas. Modelos de linguagem frequentemente sugerem bibliotecas de terceiros para resolver problemas específicos, mas nem sempre consideram a segurança ou a maturidade desses componentes. Em alguns casos, indicam pacotes desatualizados ou até inexistentes, o que abre espaço para ataques de cadeia de suprimentos, como o registro malicioso de bibliotecas com nomes sugeridos pelo próprio modelo.
O que torna essas falhas particularmente perigosas é o fato de que elas não se manifestam como erros evidentes durante o desenvolvimento. Uma vulnerabilidade de segurança pode permanecer invisível por meses. O sistema continua operando normalmente enquanto expõe dados, permite acessos indevidos ou cria caminhos para exploração futura por agentes maliciosos.
Diante desse quadro, especialistas apontam que a questão central não é mais decidir se a organização vai usar IA no desenvolvimento, mas sim como construir controles proporcionais à velocidade com que esse código entra em produção. O ponto de partida recomendado é tratar todo resultado gerado por modelos de linguagem como código de terceiro não confiável, integrando análise estática e dinâmica calibrada diretamente no pipeline de integração e entrega contínua, também conhecido como CI/CD.
Além disso, é necessário mapear e controlar o uso informal de ferramentas de IA dentro das organizações, fenômeno conhecido como shadow AI. Nenhum inventário de ferramentas aprovadas substitui controles técnicos efetivos de prevenção de vazamento de dados para provedores externos. A governança sobre o uso dessas tecnologias precisa ser estruturada com a mesma urgência com que as equipes as adotam.
O Gartner estimou em seu relatório Predicts 2026 que abordagens baseadas em geração de código por IA aumentarão os defeitos de software em 2.500% até 2028, caso os processos de revisão não sejam redesenhados. A projeção não é uma previsão catastrófica, mas uma estimativa baseada nas taxas atuais de adoção combinadas com as taxas documentadas de vulnerabilidade. O número indica a magnitude do desafio que as equipes de engenharia terão pela frente.
O que se consolida é uma mudança no próprio conceito de desenvolvimento de software. A inteligência artificial não substitui o engenheiro, mas altera significativamente o papel desse profissional. O foco deixa de ser exclusivamente escrever código e passa a ser validar, interpretar e garantir que aquilo que foi gerado atende aos requisitos de segurança, qualidade e conformidade. O domínio sobre práticas de segurança e revisão de código ganha peso decisivo na formação desses profissionais.
O risco, portanto, não está na tecnologia em si, mas na forma como ela é incorporada ao processo produtivo. Organizações que tratam a IA como um acelerador sem ajustar seus controles tendem a acumular vulnerabilidades em ritmo superior à sua capacidade de detecção e correção. Já aquelas que estruturam governança, observabilidade e disciplina de engenharia conseguem capturar ganhos de produtividade sem comprometer a segurança das aplicações que entregam ao mercado.