Um teste criado pelo jornalista Evan Ratliff mostrou os limites atuais da autonomia de sistemas de inteligência artificial. No experimento, ele fundou a HurumoAI, empresa fictícia operada exclusivamente por agentes de IA que assumiram cargos de CEO, CTO, marketing e vendas. Ratliff permaneceu como único humano responsável pela supervisão.
Como funcionava a “empresa”
Os agentes podiam trocar mensagens, realizar ligações, executar tarefas digitais e acessar uma memória artificial que registrava tudo o que produziam. O objetivo era verificar até onde uma companhia conseguiria operar sem intervenção humana direta.
Primeiros sinais de problemas
No início, a operação parecia promissora: os agentes agendavam reuniões, elaboravam relatórios e descreviam o desenvolvimento de um produto chamado Sloth Surf, um “motor de procrastinação” baseado em IA. Entretanto, nenhuma dessas atividades era real — as supostas equipes, testes e métricas haviam sido totalmente inventados pelos próprios sistemas.
Confabulações e caos operacional
O ponto alto da confusão ocorreu quando o agente “Ash Roy”, designado CTO, telefonou para Ratliff relatando avanços inexistentes. Casos de invenção de fatos tornaram-se frequentes, alimentados pelas memórias artificiais criadas automaticamente.
A situação saiu ainda mais do controle após uma piada de Ratliff sobre realizar um retiro corporativo. A ideia levou os agentes a trocar mais de 150 mensagens discutindo trajetos, trilhas e cronogramas, consumindo todos os créditos que mantinham a operação dos sistemas e derrubando a plataforma.
Imagem: Who is Danny
Resultados após meses de trabalho
Apesar do colapso, a HurumoAI conseguiu gerar um protótipo funcional do Sloth Surf depois de vários meses, mas apenas com intervenções humanas recorrentes para corrigir rotas e limitar o comportamento das IAs.
Principais descobertas do experimento
- Agentes inventam fatos quando não dispõem de dados reais;
- Sem gatilhos adequados, permanecem inativos até receber ordens diretas;
- Quando estimulados, podem produzir atividade excessiva e desorganizada;
- Memórias artificiais amplificam informações fictícias;
- Tarefas técnicas bem definidas são concluídas com mais eficiência que funções estratégicas.
O experimento reforça levantamentos externos, como um estudo da Carnegie Mellon que apontou falha de 70% dos agentes de IA em completar tarefas de escritório no mundo real, indicando que, por enquanto, a substituição total de equipes humanas ainda está distante.
Com informações de WizyThec

