A Microsoft identificou uma vulnerabilidade batizada de Whisper Leak que coloca em risco a confidencialidade de diálogos mantidos com assistentes de inteligência artificial, como ChatGPT e Google Gemini. Segundo a companhia, o problema afeta a maioria dos 28 modelos de linguagem de grande escala (LLMs) avaliados em testes internos e possibilita que terceiros descubram o tema da conversa, mesmo sem acesso ao texto trocado.
Como o ataque funciona
As interações com chatbots são protegidas pelo protocolo TLS, o mesmo empregado em transações bancárias on-line. Embora o TLS impeça a leitura direta das mensagens, ele não oculta totalmente os metadados — tamanho dos pacotes e intervalos entre eles. Foi justamente essa brecha que os pesquisadores exploraram.
Durante os experimentos, a equipe separou duas categorias de perguntas: uma sobre um tópico sensível (lavagem de dinheiro) e outra composta por consultas variadas. Um sistema de IA treinado apenas com os padrões de tráfego alcançou precisão superior a 98% na identificação do tema. Em alguns cenários, a identificação de tópicos sensíveis atingiu 100% de acerto, mesmo quando representavam apenas 1 em cada 10 mil conversas.
Tentativas de mitigação fracassam
Os pesquisadores aplicaram três métodos de defesa, mas nenhum foi capaz de eliminar completamente o vazamento. A falha não se origina na criptografia do TLS, e sim na forma como os dados são transmitidos, observaram os autores do estudo.
Risco generalizado
A Microsoft reforçou que é necessária uma resposta rápida do setor para impedir que futuras gerações de modelos de IA sejam afetadas. Entre os principais pontos destacados no relatório estão:
Imagem: Owlie Productis
- A falha afeta a maioria dos modelos avaliados;
- Metadados de tráfego permitem inferir o assunto das conversas;
- O método de detecção superou 98% de precisão;
- Nenhuma solução testada bloqueou totalmente o vazamento;
- A empresa pede reforço imediato das medidas de segurança em sistemas de IA.
Para a Microsoft, desenvolver novas proteções contra a exposição de metadados é fundamental, sobretudo à medida que assistentes virtuais passam a lidar com informações cada vez mais sensíveis.
Com informações de WizyThec

