- A Anthropic afirma que Claude Mythos supera humanos em algumas tarefas de hacking e segurança cibernética, testando vulnerabilidades e oferecendo possíveis caminhos de exploração.
- O Mythos foi disponibilizado inicialmente a 12 empresas por meio do Project Glasswing, incluindo Amazon Web Services, Apple, Microsoft, Google, Nvidia, Broadcom e Crowdstrike, com foco em proteger sistemas críticos.
- A empresa informou que vai ampliar o acesso a mais 150 instituições de setores como energia, água, saúde, comunicações e equipamentos, mediante requisitos de segurança.
- Reguladores e representantes do setor financeiro chegaram a discutir o tema em reuniões internacionais, como no Fundo Monetário Internacional, devido aos riscos potenciais para serviços digitais.
- Especialistas permanecem céticos em relação às capacidades do Mythos e destacam que, em sistemas bem protegidos, a eficácia da ferramenta pode variar; há consenso sobre a importância de fortalecer a cibersegurança básica.
O que aconteceu: a Anthropic afirmou que seu modelo de IA, Claude Mythos, supera humanos em algumas tarefas de hacking e segurança cibernética. A empresa falou sobre os resultados em testes recentes, destacando vulnerabilidades que o Mythos consegue identificar com pouca supervisão. Paralelamente, a empresa detalhou um programa de acesso controlado ao Mythos chamado Project Glasswing e anunciou planos de ampliar esse acesso a 150 instituições adicionais.
Quem está envolvido: além da Anthropic, grandes nomes da tecnologia participam do projeto Glasswing, incluindo Amazon Web Services, Apple, Microsoft, Google, Nvidia e Broadcom. A CrowdStrike também figura entre os parceiros, com mais de 40 organizações consideradas críticas recebendo acesso ao Mythos. O CEO da Anthropic, Dario Amodei, participou do lançamento, enfatizando o apoio a servidores governamentais para se defender contra riscos dos modelos.
Quando e onde: as informações sobre o Mythos foram apresentadas no início de abril, com a divulgação pública de um vídeo do Glasswing na ocasião. Em abril, a imprensa passou a acompanhar discussões sobre o modelo durante reuniões internacionais, incluindo o FMI em Washington. A UE informou andamento de conversas com a Anthropic a partir de maio.
Por que isso importa: a Anthropic afirma que o Mythos pode localizar milhares de vulnerabilidades de alta gravidade em sistemas operacionais e navegadores, com potencial disseminação rápida dessas capacidades. Reguladores, bancos centrais e instituições financeiras passaram a discutir os riscos para serviços digitais e a segurança de redes críticas.
Contexto e implicações
Especialistas em cibersegurança dividem opiniões sobre a real capacidade do Mythos. Alguns dizem que o modelo é excepcional em tarefas de segurança, enquanto outros permanecem céticos até que haja testes independentes amplos. A avaliação pública mantém o foco na distinção entre avanços reais e exageros de marketing.
Reações oficiais e alterações de acesso
Autoridades financeiras internacionais comentaram o tema em ambientes oficiais, ressaltando a necessidade de avaliar impactos sobre o risco cibernético. O Canadá trouxe a discussão ao FMI; o Reino Unido destacou a importância de analisar impactos potenciais no crime cibernético. A UE confirmou negociações com a Anthropic sobre preocupações regulatórias.
Perspectivas técnicas e debates
Analistas lembram que ferramentas de IA não substituem práticas de segurança básicas. Mesmo com vulnerabilidades, sistemas bem protegidos tendem a manter resistência. Pesquisadores enfatizam que ataques simples ainda representam risco relevante, independentemente do avanço de IA.
Desdobramentos recentes
Em abril, a Anthropic informou que investiga denúncia de acesso não autorizado ao Claude Mythos Preview por meio de um fornecedor terceirizado, resposta a uma reportagem da Bloomberg sobre acesso não autorizado em um fórum privado. A empresa reiterou o interesse em reforçar defesas contra uso indevido do modelo.
Perspectiva do setor
Para alguns especialistas, existem oportunidades de utilizar ferramentas de IA para corrigir vulnerabilidades da internet no médio prazo. Outros alertam para a necessidade de equilíbrio entre inovação e segurança, com foco na mitigação de riscos em plataformas críticas.
Entre na conversa da comunidade