Anthropic desativa Claude Fable 5 para cumprir ordem do governo dos EUA

A Anthropic desativou o Claude Fable 5 para cumprir uma ordem do governo dos EUA, que cita preocupações de segurança nacional e determinou suspender o acesso a estrangeiros, incluindo funcionários da empresa.
A empresa afirma ter identificado uma suposta técnica de “jailbreaking” do modelo Fable 5 e disse que a demonstração utilizada para detectá-la envolveu vulnerabilidades já conhecidas.
A ordem foi recebida na tarde de sexta-feira, às 17h21, e a Anthropic suspendeu o acesso de todos os clientes para atender à orientação.
Em uma publicação, a empresa ressalta que implementou salvaguardas fortes e que o jailbreak encontrado seria limitado e não tornaria o modelo mais perigoso que outras inteligências artificiais disponíveis.
A relação com o governo já envolve disputas anteriores, incluindo uma designação do Departamento de Defesa dos Estados Unidos que restringiu o uso de tecnologia da empresa por agências e contratados.

Anthropic anunciou que vai manter Claude Fable 5 offline para cumprir uma ordem do governo dos EUA. A medida afeta também Mythos 5, seguindo uma diretiva de controle de exportação por motivos de segurança nacional. O bloqueio ocorre após a identificação de uma suposta forma de burlar o modelo, o que motivou a suspensão de acessos.

A decisão, comunicada em blog da empresa, chegou na tarde de sexta-feira, por meio de uma carta formal recebida às 17h21 no fuso ET. A Anthropic afirma que a carta não detalhou os aspectos de segurança, mas que a resposta foi suspender o acesso a todos os usuários, inclusive nacionais estrangeiros.

Segundo a empresa, o governo disse ter identificado uma possível técnica de jailbreak do Fable 5. A Anthropic afirma ter avaliado a demonstração com cuidado e que as falhas aparentes são simples e já foram exploradas em outros modelos públicos sem depender do bypass.

A startup sustenta que implementou salvaguardas robustas para reduzir mau uso de Claude Fable 5. Em nota, a companhia afirma que o jailbreak encontrado é pontual e não tornaria um atacante significativamente mais perigoso em comparação com outros modelos de IA.

O texto da Anthropic também aponta que, até o momento, o governo apresentou apenas evidência verbal de uma vulnerabilidade limitada. A empresa reforça que a ação governamental não segue princípios de transparência que defendia em um ensaio de políticas recente.

Nenhuma resposta oficial foi dada pela White House nem pelo Department of Commerce aos pedidos de comentário da WIRED. A Anthropic já enfrentou tensões com autoridades federais por restrições ao uso de suas tecnologias por agências e contratados do governo.