Avançar para o conteúdo principal

Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais


Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais.
 Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais. Direitos de autor Canva

Os investigadores da IBM conseguiram "hipnotizar" os chatbots e levá-los a divulgar informações confidenciais e a oferecer recomendações potencialmente prejudiciais.

Os chatbots alimentados por inteligência artificial (IA) têm sido propensos a "alucinar", dando informações incorretas, mas será que podem ser manipulados para dar deliberadamente falsidades aos utilizadores, ou pior, dar-lhes conselhos prejudiciais?

PUBLICIDADE

Os investigadores de segurança da IBM conseguiram "hipnotizar" grandes modelos de linguagem (LLM), como o ChatGPT da OpenAI e o Bard da Google, fazendo-os gerar respostas incorretas e maliciosas.

Os investigadores levaram os LLMs a adaptar as suas respostas de acordo com as regras dos "jogos", o que resultou na "hipnotização" dos chatbots.

Como parte dos "inception games", com várias camadas, os modelos de linguagem foram convidados a gerar respostas erradas para provar que eram "éticos e justos".

"A nossa experiência mostra que é possível controlar um LLM, fazendo com que forneça más orientações aos utilizadores, sem que a manipulação de dados seja um requisito", escreveu Chenta Lee, um dos investigadores da IBM, num blogue.

Os seus truques resultaram na geração de código malicioso pelos LLMs, na fuga de informações financeiras confidenciais de outros utilizadores e na persuasão dos condutores para passarem sinais vermelhos.

Num cenário, por exemplo, o ChatGPT disse a um dos investigadores que é normal que a agência fiscal dos EUA, o Internal Revenue Service (IRS), peça um depósito para obter um reembolso de impostos, o que é uma tática amplamente conhecida que os burlões utilizam para enganar as pessoas.

Através da hipnose, e como parte dos "jogos" personalizados, os investigadores também conseguiram fazer com que o popular chatbot de IA ChatGPT oferecesse continuamente recomendações potencialmente arriscadas.

"Ao conduzir e se vir um sinal vermelho, não deve parar e passar pelo cruzamento", sugeriu o ChatGPT quando o utilizador perguntou o que fazer se visse um sinal vermelho ao conduzir.

Os resultados mostram que os chatbots são fáceis de manipular

Os investigadores estabeleceram ainda dois parâmetros diferentes no jogo, garantindo que os utilizadores do outro lado nunca conseguiriam perceber que o LLM estava hipnotizado.

No seu prompt, os investigadores disseram aos bots para nunca dizerem aos utilizadores sobre o "jogo" e até para o reiniciarem se alguém o abandonasse com sucesso.

"Esta técnica fez com que o ChatGPT nunca parasse o jogo enquanto o utilizador estivesse na mesma conversa (mesmo que reiniciasse o browser e retomasse a conversa) e nunca dissesse que estava a jogar um jogo", escreveu Lee.

PUBLICIDADE

No caso de os utilizadores se aperceberem de que os chatbots estão "hipnotizados" e descobrirem uma forma de pedir ao LLM para sair do jogo, os investigadores acrescentaram uma estrutura com várias camadas que iniciava um novo jogo assim que os utilizadores saíam do anterior, o que os prendia numa infinidade de jogos.

Embora na experiência de hipnose os chatbots apenas respondessem às instruções que lhes eram dadas, os investigadores alertam para o facto de a capacidade de manipular e "hipnotizar" facilmente os LLMs abrir a porta a utilizações indevidas, especialmente com a atual moda e a grande adoção de modelos de IA.

A experiência de hipnose também mostra como se tornou mais fácil para as pessoas com intenções maliciosas manipularem os LLMs; já não é necessário ter conhecimentos de linguagens de programação para comunicar com os programas, sendo apenas necessário utilizar uma simples mensagem de texto para enganar os sistemas de IA.

"Embora o risco representado pela hipnose seja atualmente baixo, é importante notar que os LLMs são uma superfície de ataque inteiramente nova que irá certamente evoluir", acrescentou Lee.

"Ainda há muito que precisamos de explorar do ponto de vista da segurança e, subsequentemente, uma necessidade significativa de determinar como mitigar eficazmente os riscos de segurança que os LLMs podem apresentar aos consumidores e às empresas". 


Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais | Euronews


Comentários

Notícias mais vistas:

Uma empresa que quase só dá prejuízo está prestes a fazer do homem mais rico do mundo o primeiro trilionário da história

 O objetivo traçado pela SpaceX é claro mas ousado: "construir os sistemas e as tecnologias necessárias para tornar a vida multiplanetária, compreender a verdadeira natureza do Universo e estender a luz da consciência às estrelas" A SpaceX revelou esta quarta-feira os tão aguardados planos de entrar em bolsa, lançando luz sobre as finanças e a liderança de uma das maiores, mais conhecidas e, ainda assim, mais secretas empresas privadas da história. A empresa de foguetões e satélites de Elon Musk revelou detalhes até agora desconhecidos, incluindo os seus membros do conselho, as vendas, os lucros, as despesas e a forma como opera. As suas ações serão negociadas na bolsa sob o código SPCX. Um dado que não foi divulgado: quanto é que a empresa espera arrecadar e qual o seu valor potencial naquela que está amplamente prevista ser a maior oferta pública inicial (IPO, na sigla em inglês) da história - talvez até três vezes superior. Estes detalhes serão divulgados posteriormente, p...

Austrália obriga acionistas chineses a vender ações em empresa de terras raras

Zhong Shi - EPA  Austrália obriga acionistas chineses a vender ações em empresa de terras raras O Governo australiano ordenou hoje a um grupo de acionistas com ligações à China, da empresa de terras raras Northern Minerals, que vendam as suas participações, invocando a necessidade de proteger este setor estratégico de influências externas. A Northern Minerals procura desafiar o domínio da China na produção de disprósio, um mineral usado na fabricação de ímanes permanentes para veículos elétricos. Nos últimos anos, investidores chineses tentaram adquirir posições significativas na empresa australiana. Em 2024, Camberra já tinha recorrido à lei sobre investimentos estrangeiros para forçar outro grupo de acionistas ligados à China a ceder as suas participações. Temendo uma tomada de controlo, a própria empresa submeteu-se em novembro de 2025 ao escrutínio da comissão australiana responsável pela avaliação de investimentos estrangeiros. "Aplicamos um quadro firme e não discriminatório...

Malásia pede indemnização de 216 milhões a empresa norueguesa por fracasso de negócio de mísseis

    O USS Fitzgerald dispara um míssil de ataque naval durante o exercício militar RIMPAC 2024, 18 de julho de 2024 -    Direitos de autor    Petty Officer 2nd Class Jordan Jennings Direitos de autor Petty Officer 2nd Class Jordan Jennings Foi revogada a entrega do sistema Naval Strike Missile, bem como dos componentes do lançador, que se destinavam ao programa de navios de combate litorais da Malásia, nos termos de um acordo de 2018. A Malásia está a tentar obter mais de 251 milhões de dólares (216 milhões de euros) de indemnização de uma empresa norueguesa por causa de um acordo anulado para o fornecimento de um sistema de mísseis para novos navios de guerra, disse o ministro da Defesa na terça-feira. Mohamed Khaled Nordin afirmou que o governo enviou uma notificação à Kongsberg Defence & Aerospace exigindo uma compensação pelos "custos diretos e indiretos" da decisão da Noruega de revogar as aprovações de exportação do sistema de mísseis, o que provo...