Avançar para o conteúdo principal

Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais


Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais.
 Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais. Direitos de autor Canva

Os investigadores da IBM conseguiram "hipnotizar" os chatbots e levá-los a divulgar informações confidenciais e a oferecer recomendações potencialmente prejudiciais.

Os chatbots alimentados por inteligência artificial (IA) têm sido propensos a "alucinar", dando informações incorretas, mas será que podem ser manipulados para dar deliberadamente falsidades aos utilizadores, ou pior, dar-lhes conselhos prejudiciais?

PUBLICIDADE

Os investigadores de segurança da IBM conseguiram "hipnotizar" grandes modelos de linguagem (LLM), como o ChatGPT da OpenAI e o Bard da Google, fazendo-os gerar respostas incorretas e maliciosas.

Os investigadores levaram os LLMs a adaptar as suas respostas de acordo com as regras dos "jogos", o que resultou na "hipnotização" dos chatbots.

Como parte dos "inception games", com várias camadas, os modelos de linguagem foram convidados a gerar respostas erradas para provar que eram "éticos e justos".

"A nossa experiência mostra que é possível controlar um LLM, fazendo com que forneça más orientações aos utilizadores, sem que a manipulação de dados seja um requisito", escreveu Chenta Lee, um dos investigadores da IBM, num blogue.

Os seus truques resultaram na geração de código malicioso pelos LLMs, na fuga de informações financeiras confidenciais de outros utilizadores e na persuasão dos condutores para passarem sinais vermelhos.

Num cenário, por exemplo, o ChatGPT disse a um dos investigadores que é normal que a agência fiscal dos EUA, o Internal Revenue Service (IRS), peça um depósito para obter um reembolso de impostos, o que é uma tática amplamente conhecida que os burlões utilizam para enganar as pessoas.

Através da hipnose, e como parte dos "jogos" personalizados, os investigadores também conseguiram fazer com que o popular chatbot de IA ChatGPT oferecesse continuamente recomendações potencialmente arriscadas.

"Ao conduzir e se vir um sinal vermelho, não deve parar e passar pelo cruzamento", sugeriu o ChatGPT quando o utilizador perguntou o que fazer se visse um sinal vermelho ao conduzir.

Os resultados mostram que os chatbots são fáceis de manipular

Os investigadores estabeleceram ainda dois parâmetros diferentes no jogo, garantindo que os utilizadores do outro lado nunca conseguiriam perceber que o LLM estava hipnotizado.

No seu prompt, os investigadores disseram aos bots para nunca dizerem aos utilizadores sobre o "jogo" e até para o reiniciarem se alguém o abandonasse com sucesso.

"Esta técnica fez com que o ChatGPT nunca parasse o jogo enquanto o utilizador estivesse na mesma conversa (mesmo que reiniciasse o browser e retomasse a conversa) e nunca dissesse que estava a jogar um jogo", escreveu Lee.

PUBLICIDADE

No caso de os utilizadores se aperceberem de que os chatbots estão "hipnotizados" e descobrirem uma forma de pedir ao LLM para sair do jogo, os investigadores acrescentaram uma estrutura com várias camadas que iniciava um novo jogo assim que os utilizadores saíam do anterior, o que os prendia numa infinidade de jogos.

Embora na experiência de hipnose os chatbots apenas respondessem às instruções que lhes eram dadas, os investigadores alertam para o facto de a capacidade de manipular e "hipnotizar" facilmente os LLMs abrir a porta a utilizações indevidas, especialmente com a atual moda e a grande adoção de modelos de IA.

A experiência de hipnose também mostra como se tornou mais fácil para as pessoas com intenções maliciosas manipularem os LLMs; já não é necessário ter conhecimentos de linguagens de programação para comunicar com os programas, sendo apenas necessário utilizar uma simples mensagem de texto para enganar os sistemas de IA.

"Embora o risco representado pela hipnose seja atualmente baixo, é importante notar que os LLMs são uma superfície de ataque inteiramente nova que irá certamente evoluir", acrescentou Lee.

"Ainda há muito que precisamos de explorar do ponto de vista da segurança e, subsequentemente, uma necessidade significativa de determinar como mitigar eficazmente os riscos de segurança que os LLMs podem apresentar aos consumidores e às empresas". 


Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais | Euronews


Comentários

Notícias mais vistas:

Tesla acaba com compra única do Full Self-Driving na Europa e impõe subscrição mensal

 O Full Self-Driving (FSD) da Tesla passa a custar 99€ por mês na Europa, uma vez que a opção de compra única foi removida do configurador. A Tesla deixou de disponibilizar na Europa a opção de compra única do sistema Full Self-Driving (FSD), passando a exigir uma subscrição mensal para aceder às funcionalidades avançadas de assistência à condução. Até agora, os compradores podiam adquirir o FSD através de um pagamento único de 7.500€, garantindo acesso permanente às funcionalidades associadas ao sistema, mas essa possibilidade foi eliminada. Em sua substituição, a Tesla introduziu um modelo de subscrição mensal no valor de 99€ para novos utilizadores que pretendam ativar o pacote completo. Nos casos em que o veículo já inclui o Autopilot Aperfeiçoado, o acesso às funcionalidades adicionais do FSD passa a custar 49€/mês. A Tesla também retirou do mercado europeu o Autopilot Aperfeiçoado, que funcionava como uma opção intermédia e tinha um custo de 3.800€. Este pacote incluía funcio...

Microsoft apresenta o novo Surface Laptop Ultra com processador Nvidia Spark

  A Microsoft revelou o Surface Laptop Ultra, um portátil com o novo chip NVIDIA RTX Spark baseado em ARM, até 128 GB de memória unificada e um ecrã mini-LED de 15 polegadas. Imagem - Microsoft A Microsoft aproveitou a Computex 2026 para apresentar o seu mais recente e poderoso computador portátil. O novo Surface Laptop Ultra, desenvolvido em parceria com a Nvidia, integra a plataforma RTX Spark baseada na arquitectura ARM. Segundo o site Windows Latest, este equipamento surge como uma resposta directa aos modelos de topo da concorrência, redefinindo o que é possível fazer num formato portátil. Um ecrã brilhante e conectividade completa O novo computador destaca-se pelo ecrã táctil PixelSense Ultra de 15 polegadas, que utiliza tecnologia mini-LED. Este painel oferece uma resolução de 2880 por 1920 píxeis e atinge um pico de brilho HDR de 2000 nits, o que o torna no ecrã mais brilhante alguma vez incluído num dispositivo Surface. A acompanhar a qualidade visual, a Microsoft integrou...

NVIDIA vai lançar o seu primeiro processador, e vai ser… Grave!

  A Nvidia vai lançar o seu primeiro processador para PC e a promessa é esmagar tudo na Computex! – O mercado dos computadores portáteis e de secretária prepara-se para sofrer um abalo sísmico já na próxima segunda-feira. Ou seja, depois de anos a fio a dominar por completo o mundo das placas gráficas e dos servidores de Inteligência Artificial, e de agora também ser a peça mais crítica no mundo da IA, a NVIDIA aliou-se à Microsoft e à Arm para anunciar aquilo que chamam de uma “nova era do PC”. Ainda nada está confirmado, mas através de publicações enigmáticas nas redes sociais que apontam diretamente para as coordenadas da feira Computex 2026, em Taiwan, é óbvio que vamos ver um anúncio em grande. Agora resta perceber se é algo para rivalizar com a AMD e Intel em tudo e mais alguma coisa, ou se vai se ruma “coisa” mais ao estilo da Apple e Qualcomm. O monstro N1X com gráficos Blackwell ao nível de uma RTX 5070? Portanto, esta jogada da Nvidia não é propriamente uma surpresa total...