Nos últimos meses, os modelos de IA deixaram de produzir alucinações e tornaram-se eficazes na detecção de falhas de segurança em software, de acordo com desenvolvedores que mantêm infraestrutura cibernética amplamente utilizada. Esses softwares, entre outras coisas, alimentam sistemas operacionais e transferem dados para coisas conectadas à Internet.
Embora essas novas capacidades possam ajudar os desenvolvedores a tornar o software mais seguro, elas também podem ser utilizadas por hackers e estados-nação para roubar informações e dinheiro ou interromper serviços críticos.
O mais recente desenvolvimento da capacidade cibernética da IA ocorreu na terça-feira, quando o laboratório de IA Anthropic anunciou que havia desenvolvido um novo modelo poderoso que a empresa acredita que poderia “remodelar a segurança cibernética”. Ele disse que seu modelo mais recente, Mythos Preview, foi capaz de encontrar “vulnerabilidades de alta gravidade, incluindo algumas em todos os principais sistemas operacionais e navegadores da web”. Além disso, o modelo foi melhor em encontrar maneiras de explorar as vulnerabilidades encontradas, o que significa que os atores mal-intencionados podem atingir seus objetivos de maneira mais eficaz.
Por enquanto, a empresa está limitando o acesso ao modelo a cerca de 50 empresas e organizações selecionadas “em um esforço para proteger o software mais crítico do mundo”. Eles estão chamando a colaboração de Projeto Glasswing, em homenagem a uma espécie de borboleta com asas transparentes.
A Antrópica afirma que o risco de uso indevido é tão alto que não tem planos de lançar este modelo específico ao público em geral, segundo o anúncio, mas lançará outros modelos relacionados. “Nosso objetivo final é permitir que nossos usuários implantem modelos da classe Mythos em escala com segurança”, escreveu a empresa.
Ainda assim, os especialistas em segurança dizem que os riscos potenciais são para os profissionais de segurança cibernética e não para as pessoas comuns. “Não acho necessariamente que o usuário médio de computador precise estar fundamentalmente preocupado com isso”, disse Daniel Blackford, vice-presidente de pesquisa de ameaças da Proofpoint, uma empresa de segurança cibernética. “Eles precisam estar muito mais preocupados em não revelar suas senhas, porque isso acontece o dia todo, todos os dias”.
O Mythos Preview também pode ter melhores recursos para ajudar os desenvolvedores a corrigir vulnerabilidades do que os modelos anteriores, disse Jim Zemlin, CEO da Linux Foundation, que hospeda o kernel Linux de código aberto. Um kernel é uma interface que permite que o hardware se comunique com o software, e o kernel do Linux alimenta alguns dos sistemas operacionais mais usados, incluindo o Android, bem como todos os 500 supercomputadores mais poderosos do mundo. A fundação faz parte do Projeto Glasswing, e Zemlin disse que um grupo central de pessoas que trabalham no kernel Linux, conhecidos como mantenedores, começaram a experimentar o novo modelo para descobrir a maneira mais eficaz de usá-lo.
“Esses mantenedores já estavam sobrecarregados antes da IA”, disse Zemlin. “Isso só torna a vida deles muito melhor.”
Mesmo antes do lançamento limitado do Mythos Preview, a comunidade de segurança cibernética já estava lutando para descobrir a capacidade dos modelos de IA mais avançados disponíveis comercialmente. Os desenvolvedores estão correndo para corrigir vulnerabilidades de segurança que os hackers sinalizam com IA. Os especialistas em segurança estão preocupados com o que poderá acontecer se essas capacidades proliferarem sem barreiras de proteção.
Os hackers estão usando IA para ajudá-los a encontrar bugs. Não estava funcionando, até agora
A melhoria nas capacidades dos modelos de IA tornou-se perceptível no início de 2026, disse Daniel Stenberg. Ele é o principal desenvolvedor de software por trás do cURL, uma ferramenta de transferência de dados de código aberto com 30 anos de existência, amplamente usada para coisas que se conectam à Internet, incluindo carros e dispositivos médicos. Essa mudança seguiu-se ao lançamento de novos modelos de última geração no final de 2025.
Como muitos na comunidade de software, Stenberg recebe ajuda de pesquisadores de segurança para manter seu software funcional e seguro. Os chamados hackers de “chapéu branco” sinalizam falhas de segurança para os desenvolvedores em particular e, em troca, às vezes recebem recompensas em dinheiro, conhecidas como “recompensas de bugs”, ou o direito de se gabar ao obterem a falha de segurança. nomeados em homenagem a si mesmos. Embora todos os bugs afetem a funcionalidade do software, apenas alguns bugs apresentam vulnerabilidades de segurança.
Mas esse processo começou a falhar no ano passado. A equipe de Stenberg foi inundada por relatórios falsos que ele estava convencido terem sido gerados pela IA. “Recebemos 185 relatórios ao longo do ano e menos de 5% deles eram, na verdade, problemas relacionados à segurança”, disse Stenberg.
Mesmo com o volume de relatórios dobrando de 2024 para 2025, Stenberg acabou encontrando e corrigindo menos vulnerabilidades de segurança. Os relatórios de falhas ficaram tão ruins que Stenberg parou de pagar recompensas por bugs por sua ferramenta cURL.
Os hackers que enviam relatórios para ele geralmente são anônimos, disse Stenberg, e não discutem se os relatórios foram feitos com IA. Mas Stenberg disse que a IA tem um estilo de escrita distinto. “Eles tendem a ser muito elaborados e descritivos… Você recebe um relatório de 400 linhas (quando) é algo que um ser humano levaria 50 linhas para apresentar.”
HackerOne, uma plataforma que Stenberg usa para gerenciar relatórios de segurança, entrevistou hackers no verão de 2025 e descobriu que quase 60% dos entrevistados estavam usando IA, aprendendo-a ou aprendendo a auditar IA ou sistemas de aprendizado de máquina.
“LLMs agora contornaram a capacidade humana para encontrar bugs”
As coisas mudaram dramaticamente este ano. O volume de relatórios foi ainda maior do que em 2025, mas até agora, disse Stenberg, a maioria deles revelou questões legítimas. “Quase todos os (relatórios) ruins desapareceram.”
Ele estima que cerca de 1 em cada 10 relatórios são vulnerabilidades de segurança, o restante são, em sua maioria, bugs reais. Apenas três meses em 2026, a equipe cURL liderada por Stenberg encontrou e corrigiu mais vulnerabilidades do que em cada um dos dois anos anteriores.
Além dos relatórios de pesquisadores de segurança externos, Stenberg também usa IA para encontrar vulnerabilidades. Com um clique, a IA sinalizou mais de 100 bugs em seu código, que passaram por rodadas de revisão por humanos e analisadores de código tradicionais “de maneiras quase mágicas”.
A experiência de Stenberg não é única. Mantenedores do kernel Linux tem visto uma mudança semelhante na qualidade dos relatórios de bugs. Nicholas Carlini, um cientista pesquisador antrópico, conseguiu encontrar vulnerabilidades no kernel Linux usando um modelo antrópico mais antigo e um prompt relativamente simples. Carlini também usou IA para encontrar a primeira vulnerabilidade crítica em outro projeto de código aberto de 20 anos.
“Os LLMs agora contornaram a capacidade humana de encontrar bugs”, disse Alex Stamos, diretor de segurança da Corridor, uma empresa de segurança de software de IA. O aumento na qualidade dos relatórios de pesquisa de segurança seguiu-se ao lançamento de Modelo Opus 4.5 da Antrópico em novembro, disse Stamos, que anteriormente foi chefe de segurança do Yahoo e do Facebook. Como muitos softwares comerciais possuem componentes de código aberto, o que acontece com os projetos de código aberto tem implicações mais amplas para a Internet, disse Stamos.
A IA pode corrigir os bugs e vulnerabilidades de segurança que encontra?
Stenberg reconhece que os modelos de IA atualmente disponíveis para todos se tornaram mais úteis na localização de bugs, mas ele também está cauteloso com o que modelos futuros e mais poderosos podem trazer para os desenvolvedores que mantêm software de código aberto. “É uma sobrecarga para todos os mantenedores, que muitas vezes já estão sobrecarregados, com falta de pessoal, mal pagos e subfinanciados de várias maneiras.”
Stenberg não faz parte do Projeto Glasswing e diz que muitos projetos críticos, “coisas que são na verdade os pilares da Internet”, foram deixados de fora.
A Antrópico não respondeu ao pedido de comentários da NPR.
Mas com base na sua experiência até agora, Stenberg diz que a IA não é tão boa a corrigir bugs e falhas de segurança como é a localizá-los.
Parte do motivo é que nem os bugs nem suas correções são definitivos. Como muitos outros aspectos do desenvolvimento de software, tomar decisões leva mais tempo do que realmente escrever o código. “Depois de identificarmos o problema e concordarmos que se trata de um problema, então resolvê-lo não será muito difícil e nem consumirá muito tempo. É mais todo o processo até essa etapa que leva tempo e energia”, disse Stenberg.
Outros pensam de forma diferente. Uma empresa chamada HackerOne está agora desenvolvendo um produto de IA agente para encontrar — e corrigir — vulnerabilidades de forma mais autônoma.
Como a IA influencia o cabo de guerra entre o ataque e a defesa na segurança cibernética?
“Encontrar bugs não significa torná-los exploráveis”, disse Stamos. “A primeira parte do que chamamos de cadeia de destruição é descobrir as falhas. O próximo passo é… (na verdade) construir a arma. E os modelos básicos não farão isso por você.”
Os modelos básicos são modelos feitos pelos laboratórios de IA mais avançados, como Anthropic, OpenAI e Google Deepmind. Esses laboratórios implementaram proteções para evitar que seus modelos criem software que possa ser usado maliciosamente. Esses modelos são altamente proprietários e seu funcionamento interno não é público.
Mas todas as apostas serão canceladas quando os chamados modelos de peso aberto, mais acessíveis ao público, alcançarem os dos laboratórios de IA mais avançados. Os malfeitores podem fazer uma cópia deles e remover as proteções contra malware.
“Então estamos em sérios apuros porque seria possível pedir a esses modelos não apenas para encontrarem os bugs, mas também para criarem códigos de exploração” que podem invadir sistemas, disse Stamos. Os modelos abertos mais avançados estão menos de um ano atrás dos modelos fechados mais avançados.
“Isso também mostra quão incrivelmente estúpido é o Pentágono dizer que o Antrópico é um risco para todos os Estados Unidos”, acrescentou Stamos. O Pentágono classificou a Anthropic como um “risco da cadeia de abastecimento” porque a empresa pediu ao governo que não utilizasse a sua tecnologia para armas autónomas e vigilância em massa. O rótulo impediria agências governamentais e empreiteiros de trabalhar com a Antrópica. A Anthropic está atualmente disputando o rótulo na Justiça.
A maioria dos modelos abertos é fabricada por empresas sediadas na China, que os EUA consideram o seu principal rival na corrida ao domínio da IA. Ao não divulgar publicamente o Mythos Preview, disse Stamos, a Anthropic está dando aos desenvolvedores de software, bem como aos EUA, tempo para reforçar suas defesas.