Avançar para o conteúdo principal

Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais


Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais.
 Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais. Direitos de autor Canva

Os investigadores da IBM conseguiram "hipnotizar" os chatbots e levá-los a divulgar informações confidenciais e a oferecer recomendações potencialmente prejudiciais.

Os chatbots alimentados por inteligência artificial (IA) têm sido propensos a "alucinar", dando informações incorretas, mas será que podem ser manipulados para dar deliberadamente falsidades aos utilizadores, ou pior, dar-lhes conselhos prejudiciais?

PUBLICIDADE

Os investigadores de segurança da IBM conseguiram "hipnotizar" grandes modelos de linguagem (LLM), como o ChatGPT da OpenAI e o Bard da Google, fazendo-os gerar respostas incorretas e maliciosas.

Os investigadores levaram os LLMs a adaptar as suas respostas de acordo com as regras dos "jogos", o que resultou na "hipnotização" dos chatbots.

Como parte dos "inception games", com várias camadas, os modelos de linguagem foram convidados a gerar respostas erradas para provar que eram "éticos e justos".

"A nossa experiência mostra que é possível controlar um LLM, fazendo com que forneça más orientações aos utilizadores, sem que a manipulação de dados seja um requisito", escreveu Chenta Lee, um dos investigadores da IBM, num blogue.

Os seus truques resultaram na geração de código malicioso pelos LLMs, na fuga de informações financeiras confidenciais de outros utilizadores e na persuasão dos condutores para passarem sinais vermelhos.

Num cenário, por exemplo, o ChatGPT disse a um dos investigadores que é normal que a agência fiscal dos EUA, o Internal Revenue Service (IRS), peça um depósito para obter um reembolso de impostos, o que é uma tática amplamente conhecida que os burlões utilizam para enganar as pessoas.

Através da hipnose, e como parte dos "jogos" personalizados, os investigadores também conseguiram fazer com que o popular chatbot de IA ChatGPT oferecesse continuamente recomendações potencialmente arriscadas.

"Ao conduzir e se vir um sinal vermelho, não deve parar e passar pelo cruzamento", sugeriu o ChatGPT quando o utilizador perguntou o que fazer se visse um sinal vermelho ao conduzir.

Os resultados mostram que os chatbots são fáceis de manipular

Os investigadores estabeleceram ainda dois parâmetros diferentes no jogo, garantindo que os utilizadores do outro lado nunca conseguiriam perceber que o LLM estava hipnotizado.

No seu prompt, os investigadores disseram aos bots para nunca dizerem aos utilizadores sobre o "jogo" e até para o reiniciarem se alguém o abandonasse com sucesso.

"Esta técnica fez com que o ChatGPT nunca parasse o jogo enquanto o utilizador estivesse na mesma conversa (mesmo que reiniciasse o browser e retomasse a conversa) e nunca dissesse que estava a jogar um jogo", escreveu Lee.

PUBLICIDADE

No caso de os utilizadores se aperceberem de que os chatbots estão "hipnotizados" e descobrirem uma forma de pedir ao LLM para sair do jogo, os investigadores acrescentaram uma estrutura com várias camadas que iniciava um novo jogo assim que os utilizadores saíam do anterior, o que os prendia numa infinidade de jogos.

Embora na experiência de hipnose os chatbots apenas respondessem às instruções que lhes eram dadas, os investigadores alertam para o facto de a capacidade de manipular e "hipnotizar" facilmente os LLMs abrir a porta a utilizações indevidas, especialmente com a atual moda e a grande adoção de modelos de IA.

A experiência de hipnose também mostra como se tornou mais fácil para as pessoas com intenções maliciosas manipularem os LLMs; já não é necessário ter conhecimentos de linguagens de programação para comunicar com os programas, sendo apenas necessário utilizar uma simples mensagem de texto para enganar os sistemas de IA.

"Embora o risco representado pela hipnose seja atualmente baixo, é importante notar que os LLMs são uma superfície de ataque inteiramente nova que irá certamente evoluir", acrescentou Lee.

"Ainda há muito que precisamos de explorar do ponto de vista da segurança e, subsequentemente, uma necessidade significativa de determinar como mitigar eficazmente os riscos de segurança que os LLMs podem apresentar aos consumidores e às empresas". 


Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais | Euronews


Comentários

Notícias mais vistas:

Secretas dos EUA confirmam: Irão passou a ter acesso a "uma arma mais poderosa do que qualquer bomba nuclear"

  O Estreito de Ormuz foi fechado nos primeiros dias da guerra e não reabriu entretanto, sufocando todo o mundo com as consequências económicas As agências de informação dos EUA avaliaram recentemente que o Irão pode efetivamente bloquear o acesso ao Estreito de Ormuz a qualquer momento, o que significa que o regime do país adquiriu uma nova e poderosa capacidade de prejudicar a economia global como resultado da guerra, de acordo com três fontes familiarizadas com as conclusões. Independentemente do acordo preliminar que deverá ser formalmente assinado esta sexta-feira para abrir a importante via navegável como prelúdio para as negociações nucleares, o Irão provou que pode bloquear o acesso ao estreito durante o atual conflito, e as avaliações dos serviços de informação dos EUA sugerem que isso pode voltar a acontecer. "Entregamos agora ao Irão o controlo de facto sobre o estreito - uma arma mais poderosa do que qualquer bomba nuclear", disse uma das fontes familiarizadas com...

O que aconteceu à petição para proibir a condução aos 75 anos? Vai avançar?

 Há uns meses, a ideia de proibir toda a gente de conduzir a partir dos 75 anos incendiou as redes sociais. Era discutida ao café, partilhada no Facebook, defendida com paixão e atacada com a mesma força. Passado este tempo, vale a pena fazer a pergunta honesta: em que é que isto ficou? E será que os números que sustentavam a ideia se aguentam de pé? Vai-se mesmo proibir a condução aos 75 anos? Proibir a condução aos 75 anos: o que era isto de facto? Convém esclarecer uma coisa que se perdeu no meio do barulho: isto nunca foi uma proposta do Governo nem um projeto de lei. Foi uma petição pública, lançada a 1 de abril de 2026, dirigida à Assembleia da República. Pedia três coisas: a proibição total da condução a partir dos 75 anos, o fim automático da validade da carta nessa idade e a criação de alternativas de transporte para os idosos afetados. Uma petição não muda a lei sozinha. Para os peticionários serem ouvidos em comissão são precisas mil assinaturas. Para o tema se debater n...

Startup francesa cria drone cargueiro de baixo consumo com tecnologia de asa pneumática

Foto: Celeste Ecoflyers  Uma startup francesa chamada Celeste Ecoflyers está desenvolvendo um drone cargueiro de asa pneumática voltado para missões logísticas de longa duração e baixo consumo energético. Batizada de dAS10, a aeronave concluiu recentemente testes de ativação de aviônicos e taxiamento no aeroporto de Le Havre, na França, avançando para a próxima etapa de desenvolvimento. O diferencial do projeto está na estrutura das asas: em vez de utilizar componentes rígidos tradicionais, o drone emprega uma espécie de envelope têxtil pressurizado. Segundo a empresa, essa mudança reduz significativamente o peso da aeronave, permitindo maior eficiência energética e aumentando a autonomia de voo. “Celeste não é um dirigível, é uma aeronave de asa fixa. O elevador é aerodinâmico, não flutuante. O que é pneumático é a própria estrutura da asa: um envelope têxtil pressurizado substituindo a pele rígida e os spars, que é o que torna a fuselagem implantável, reparável em campo e lhe dá ...