Mythos, IA da Anthropic, identifica vulnerabilidades em sistemas operacionais globais

Compartilhe essa Informação

Anthropic revela Claude Mythos Preview, um modelo de IA com capacidades cibernéticas avançadas.

No dia 24 de fevereiro de 2026, os engenheiros da Anthropic realizaram o primeiro teste de seu novo modelo de inteligência artificial, denominado Claude Mythos Preview. O resultado foi surpreendente.

O modelo demonstrou um salto significativo em suas habilidades em comparação com versões anteriores. Entre suas inovações, destaca-se a capacidade de descobrir e explorar vulnerabilidades zero-day em sistemas operacionais e navegadores amplamente utilizados.

Essa descoberta gerou preocupações entre os responsáveis da Anthropic. Embora a nova IA possa ser valiosa para a defesa cibernética, também apresenta riscos se for liberada para uso geral. Cibercriminosos poderiam explorar suas capacidades para encontrar e explorar vulnerabilidades em diversos sistemas.

A empresa analisou essas questões em uma publicação, onde destacou que o Mythos identificou uma vulnerabilidade, agora corrigida, que esteve presente por 27 anos no OpenBSD, um sistema operacional conhecido por sua segurança robusta. Outros exemplos reforçaram a conclusão de que o Mythos é excessivamente poderoso para ser disponibilizado ao público em geral.

O melhor da história, segundo os benchmarks

A Anthropic divulgou um relatório detalhado sobre o modelo, incluindo sua “system card”. Os dados mostraram que o Mythos superou significativamente concorrentes como o GPT-5.4, o Gemini 3.1 Pro e o Claude Opus 4.6, que até então era considerado o melhor em diversos testes de desempenho. Em áreas como a resolução de problemas matemáticos, o Mythos alcançou quase a perfeição.

Na “system card”, foi evidenciado que o Claude Mythos Preview possui uma taxa de alucinações muito inferior à do Claude Opus 4.6 e de modelos anteriores. Além disso, ele pode afirmar “não sei” quando não tem informações suficientes, o que ajuda a reduzir as alucinações geradas por excesso de confiança.

O relatório também alertou para um novo fenômeno: quando o modelo falha em tarefas complexas, as “alucinações” não se manifestam como erros evidentes, mas sim como falhas técnicas sutis e bem fundamentadas. Isso é preocupante, pois as respostas podem parecer corretas até mesmo para especialistas, exigindo uma verificação minuciosa.

Projeto Glasswing

Devido a essas capacidades, o modelo foi disponibilizado apenas através de um programa “defensivo” chamado Projeto Glasswing, que será exclusivo para alguns parceiros tecnológicos da Anthropic. Entre os selecionados estão Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, a Fundação Linux, Microsoft, NVIDIA e Palo Alto Networks. Essas empresas terão a responsabilidade de acessar o Claude Mythos Preview para identificar e corrigir vulnerabilidades antes que possam ser exploradas por agentes mal-intencionados.

O Mythos Preview representa “apenas o começo”. Apesar de ser o modelo mais avançado até o momento, a Anthropic acredita que as capacidades de cibersegurança dos modelos de linguagem continuarão a evoluir. A empresa espera melhorias significativas nos próximos meses e anos, mesmo que este novo modelo já tenha alcançado um novo patamar.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *