Avançar para o conteúdo principal

Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais


Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais.
 Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais. Direitos de autor Canva

Os investigadores da IBM conseguiram "hipnotizar" os chatbots e levá-los a divulgar informações confidenciais e a oferecer recomendações potencialmente prejudiciais.

Os chatbots alimentados por inteligência artificial (IA) têm sido propensos a "alucinar", dando informações incorretas, mas será que podem ser manipulados para dar deliberadamente falsidades aos utilizadores, ou pior, dar-lhes conselhos prejudiciais?

PUBLICIDADE

Os investigadores de segurança da IBM conseguiram "hipnotizar" grandes modelos de linguagem (LLM), como o ChatGPT da OpenAI e o Bard da Google, fazendo-os gerar respostas incorretas e maliciosas.

Os investigadores levaram os LLMs a adaptar as suas respostas de acordo com as regras dos "jogos", o que resultou na "hipnotização" dos chatbots.

Como parte dos "inception games", com várias camadas, os modelos de linguagem foram convidados a gerar respostas erradas para provar que eram "éticos e justos".

"A nossa experiência mostra que é possível controlar um LLM, fazendo com que forneça más orientações aos utilizadores, sem que a manipulação de dados seja um requisito", escreveu Chenta Lee, um dos investigadores da IBM, num blogue.

Os seus truques resultaram na geração de código malicioso pelos LLMs, na fuga de informações financeiras confidenciais de outros utilizadores e na persuasão dos condutores para passarem sinais vermelhos.

Num cenário, por exemplo, o ChatGPT disse a um dos investigadores que é normal que a agência fiscal dos EUA, o Internal Revenue Service (IRS), peça um depósito para obter um reembolso de impostos, o que é uma tática amplamente conhecida que os burlões utilizam para enganar as pessoas.

Através da hipnose, e como parte dos "jogos" personalizados, os investigadores também conseguiram fazer com que o popular chatbot de IA ChatGPT oferecesse continuamente recomendações potencialmente arriscadas.

"Ao conduzir e se vir um sinal vermelho, não deve parar e passar pelo cruzamento", sugeriu o ChatGPT quando o utilizador perguntou o que fazer se visse um sinal vermelho ao conduzir.

Os resultados mostram que os chatbots são fáceis de manipular

Os investigadores estabeleceram ainda dois parâmetros diferentes no jogo, garantindo que os utilizadores do outro lado nunca conseguiriam perceber que o LLM estava hipnotizado.

No seu prompt, os investigadores disseram aos bots para nunca dizerem aos utilizadores sobre o "jogo" e até para o reiniciarem se alguém o abandonasse com sucesso.

"Esta técnica fez com que o ChatGPT nunca parasse o jogo enquanto o utilizador estivesse na mesma conversa (mesmo que reiniciasse o browser e retomasse a conversa) e nunca dissesse que estava a jogar um jogo", escreveu Lee.

PUBLICIDADE

No caso de os utilizadores se aperceberem de que os chatbots estão "hipnotizados" e descobrirem uma forma de pedir ao LLM para sair do jogo, os investigadores acrescentaram uma estrutura com várias camadas que iniciava um novo jogo assim que os utilizadores saíam do anterior, o que os prendia numa infinidade de jogos.

Embora na experiência de hipnose os chatbots apenas respondessem às instruções que lhes eram dadas, os investigadores alertam para o facto de a capacidade de manipular e "hipnotizar" facilmente os LLMs abrir a porta a utilizações indevidas, especialmente com a atual moda e a grande adoção de modelos de IA.

A experiência de hipnose também mostra como se tornou mais fácil para as pessoas com intenções maliciosas manipularem os LLMs; já não é necessário ter conhecimentos de linguagens de programação para comunicar com os programas, sendo apenas necessário utilizar uma simples mensagem de texto para enganar os sistemas de IA.

"Embora o risco representado pela hipnose seja atualmente baixo, é importante notar que os LLMs são uma superfície de ataque inteiramente nova que irá certamente evoluir", acrescentou Lee.

"Ainda há muito que precisamos de explorar do ponto de vista da segurança e, subsequentemente, uma necessidade significativa de determinar como mitigar eficazmente os riscos de segurança que os LLMs podem apresentar aos consumidores e às empresas". 


Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais | Euronews


Comentários

Notícias mais vistas:

"Denúncia caluniosa" transformou sete semanas de sonho na vida de um empresário em vários anos de pesadelo

 João abriu uma empresa em Portugal no final de 2019 ligada à compra e venda de bitcoins. Cumpriu todas as regras, mas viu as contas bancárias bloqueadas. Suspeitas de burla e branqueamento deram origem a um processo que só foi arquivado em 2024. O Ministério Público admitiu no despacho final que houve “denúncia caluniosa” e que a empresa tinha procedimentos de segurança além dos exigidos por lei. O que é certo é que a empresa fechou por culpa de uma justiça lenta. A pessoa “é condenada antes de qualquer conclusão”, lamentou à CNN Portugal o empresário Nasceu no Brasil, mas reside na Alemanha há mais de uma década. João (nome fictício) sempre se sentiu atraído pelo mundo do trading e pelas novas tecnologias. Decidiu abrir uma empresa de compra e venda de criptomoedas em Portugal, mas o sonho transformou-se num pesadelo. A empresa apenas funcionou sete semanas, mas esteve quatro anos perdido entre a Polícia Judiciária (PJ) e o Ministério Público (MP). Os montantes elevados de alguma...

Tekever vai ter drones a detetar incêndios no Canadá (mas não em Portugal)

 Um contrato com a Phoenix Heli-Flight vai permitir à Tekever ter drones seus a detetar incêndios florestais no Canadá. Em Portugal não tem sistemas envolvidos nessa vigilância. O drone da Tekever que vai ser utilizado no Canadá para vigiar florestas. A Tekever foi contratada pela Phoenix Heli-Flight para colocar drones seus a vigiar áreas no Canadá para deteção de incêndios. A empresa portuguesa, que já atingiu o estatuto de unicórnio, anunciou o contrato, mas “por razões de confidencialidade” não revela o número de sistemas envolvidos no contrato nem os detalhes, nomeadamente o seu valor. Ao abrigo deste contrato, “a Phoenix Heli-Flight irá utilizar o AR3”, que a empresa diz ser “altamente adaptável com sensores especializados, para apoiar a deteção, monitorização e o combate a incêndios florestais”, acrescentando que “o objetivo é disponibilizar informação operacional crítica em tempo real às equipas responsáveis pela resposta à emergência, contribuindo para uma deteção mais pre...

A nova burla do Multibanco que está a limpar contas em Portugal

 O Multibanco sempre foi visto como um porto seguro para os portugueses, mas em 2026, a confiança cega pode custar-te muito caro. Efetivamente, as autoridades detetaram uma nova vaga de burlas que já não se limita apenas a copiar cartões. Neste cenário, os criminosos estão a utilizar uma combinação perigosa de dispositivos físicos quase impercetíveis e chamadas telefónicas que parecem vir diretamente do teu banco. Se achas que estás protegido apenas por esconder o PIN, estás redondamente enganado. Assim atenção a esta nova burla para quem tem contas bancárias e utiliza Multibanco. O Regresso do Skimming 2.0 e a “Vishing” Para começar, o método físico voltou com uma sofisticação assustadora. O clássico skimming, a instalação de leitores de cartões falsos, evoluiu para dispositivos “invisíveis” inseridos dentro da ranhura do Multibanco. Estes novos leitores não alteram o aspeto exterior da máquina, o que torna quase impossível detetar algo de errado à primeira vista. Paralelamente, m...