A Anthropic anunciou uma parceria inédita com o governo dos Estados Unidos para impedir que seu chatbot Claude seja usado na elaboração de armamentos nucleares. O projeto prevê a implementação de um filtro capaz de identificar e bloquear conversas que apresentem risco de proliferação nuclear.
Segundo a empresa, cientistas da Administração Nacional de Segurança Nuclear dos EUA (NNSA) submeteram o modelo de linguagem a testes extensivos. O objetivo foi verificar se a IA poderia, ainda que indiretamente, auxiliar na concepção de uma arma nuclear. A partir desses testes, surgiu o “classificador nuclear”, mecanismo que reconhece termos, tópicos e detalhes técnicos associados à construção de ogivas.
De acordo com Marina Favaro, diretora de Políticas de Segurança Nacional da Anthropic, o classificador distingue discussões legítimas — como geração de energia ou medicina nuclear — de solicitações potencialmente perigosas. Quando qualquer diálogo se aproxima de conteúdo sensível, o sistema desativa a interação. A lista de indicadores de risco foi preparada pela NNSA; embora controlada, ela não é confidencial, permitindo que outras companhias também adotem a ferramenta.
A Anthropic declarou que pretende disponibilizar o filtro a outras desenvolvedoras de inteligência artificial. A medida tem o respaldo da Casa Branca, que acompanha iniciativas de segurança em grandes modelos de linguagem.
Imagem: gguy
Nem todos, porém, concordam com a estratégia. Especialistas consultados apontam dúvidas sobre a eficácia do bloqueio e questionam se empresas privadas devem ter acesso a informações nucleares. Heidy Khlaaf, cientista-chefe de IA do AI Now Institute, argumenta que a necessidade do filtro desapareceria caso Claude jamais tivesse contato com dados sigilosos sobre armamentos.
Com informações de WizyThec

