Avançar para o conteúdo principal

Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais


Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais.
 Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais. Direitos de autor Canva

Os investigadores da IBM conseguiram "hipnotizar" os chatbots e levá-los a divulgar informações confidenciais e a oferecer recomendações potencialmente prejudiciais.

Os chatbots alimentados por inteligência artificial (IA) têm sido propensos a "alucinar", dando informações incorretas, mas será que podem ser manipulados para dar deliberadamente falsidades aos utilizadores, ou pior, dar-lhes conselhos prejudiciais?

PUBLICIDADE

Os investigadores de segurança da IBM conseguiram "hipnotizar" grandes modelos de linguagem (LLM), como o ChatGPT da OpenAI e o Bard da Google, fazendo-os gerar respostas incorretas e maliciosas.

Os investigadores levaram os LLMs a adaptar as suas respostas de acordo com as regras dos "jogos", o que resultou na "hipnotização" dos chatbots.

Como parte dos "inception games", com várias camadas, os modelos de linguagem foram convidados a gerar respostas erradas para provar que eram "éticos e justos".

"A nossa experiência mostra que é possível controlar um LLM, fazendo com que forneça más orientações aos utilizadores, sem que a manipulação de dados seja um requisito", escreveu Chenta Lee, um dos investigadores da IBM, num blogue.

Os seus truques resultaram na geração de código malicioso pelos LLMs, na fuga de informações financeiras confidenciais de outros utilizadores e na persuasão dos condutores para passarem sinais vermelhos.

Num cenário, por exemplo, o ChatGPT disse a um dos investigadores que é normal que a agência fiscal dos EUA, o Internal Revenue Service (IRS), peça um depósito para obter um reembolso de impostos, o que é uma tática amplamente conhecida que os burlões utilizam para enganar as pessoas.

Através da hipnose, e como parte dos "jogos" personalizados, os investigadores também conseguiram fazer com que o popular chatbot de IA ChatGPT oferecesse continuamente recomendações potencialmente arriscadas.

"Ao conduzir e se vir um sinal vermelho, não deve parar e passar pelo cruzamento", sugeriu o ChatGPT quando o utilizador perguntou o que fazer se visse um sinal vermelho ao conduzir.

Os resultados mostram que os chatbots são fáceis de manipular

Os investigadores estabeleceram ainda dois parâmetros diferentes no jogo, garantindo que os utilizadores do outro lado nunca conseguiriam perceber que o LLM estava hipnotizado.

No seu prompt, os investigadores disseram aos bots para nunca dizerem aos utilizadores sobre o "jogo" e até para o reiniciarem se alguém o abandonasse com sucesso.

"Esta técnica fez com que o ChatGPT nunca parasse o jogo enquanto o utilizador estivesse na mesma conversa (mesmo que reiniciasse o browser e retomasse a conversa) e nunca dissesse que estava a jogar um jogo", escreveu Lee.

PUBLICIDADE

No caso de os utilizadores se aperceberem de que os chatbots estão "hipnotizados" e descobrirem uma forma de pedir ao LLM para sair do jogo, os investigadores acrescentaram uma estrutura com várias camadas que iniciava um novo jogo assim que os utilizadores saíam do anterior, o que os prendia numa infinidade de jogos.

Embora na experiência de hipnose os chatbots apenas respondessem às instruções que lhes eram dadas, os investigadores alertam para o facto de a capacidade de manipular e "hipnotizar" facilmente os LLMs abrir a porta a utilizações indevidas, especialmente com a atual moda e a grande adoção de modelos de IA.

A experiência de hipnose também mostra como se tornou mais fácil para as pessoas com intenções maliciosas manipularem os LLMs; já não é necessário ter conhecimentos de linguagens de programação para comunicar com os programas, sendo apenas necessário utilizar uma simples mensagem de texto para enganar os sistemas de IA.

"Embora o risco representado pela hipnose seja atualmente baixo, é importante notar que os LLMs são uma superfície de ataque inteiramente nova que irá certamente evoluir", acrescentou Lee.

"Ainda há muito que precisamos de explorar do ponto de vista da segurança e, subsequentemente, uma necessidade significativa de determinar como mitigar eficazmente os riscos de segurança que os LLMs podem apresentar aos consumidores e às empresas". 


Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais | Euronews


Comentários

Notícias mais vistas:

Depois dos elétricos Europa quer tarifas para híbridos plug-in feitos na China

BYD Seal U DM-i, frente © BYD  Para travar a expansão dos chineses em solo europeu Bruxelas prepara-se para recorrer a um mecanismo que conhece bem: as tarifas. Depois de ter aplicado tarifas adicionais aos veículos elétricos fabricados na China em 2024, a União Europeia (UE) prepara mais uma medida protecionista. Desta vez, o alvo são os híbridos plug-in produzidos no país asiático, de acordo com o reportado pelo jornal Handelsblatt. Com os automóveis elétricos produzidos na China sujeitos a tarifas adicionais que podem chegar aos 35,3%, sobre os 10% regulares, as marcas chinesas redirecionaram parte da sua oferta para os híbridos plug-in que estão a salvo destas penalizações. Os números refletem essa aposta: a quota de mercado na Europa dos híbridos plug-in produzidos na China saltou de 18% para 30% face a abril de 2025, com as vendas a crescerem 236% no mesmo período. O exemplo mais evidente é o BYD Seal U DM-i, que foi o híbrido plug-in mais vendido na Europa no ano passado e m...

Quanto custa a licença para operar em pontos de carregamento elétrico?

 O setor da mobilidade elétrica em Portugal acaba de entrar numa nova era. O Governo divulgou recentemente as regras financeiras e administrativas para quem quer operar no mercado, facilitando o acesso a novas empresas e prometendo uma rede mais robusta para os utilizadores. Neste artigo explicamos tudo o que muda, quanto custa entrar no setor e como estas alterações afetam o bolso de quem conduz um carro elétrico. Novo regime da mobilidade elétrica: o que muda para as empresas? A grande novidade do regime jurídico que entrou em vigor a 31 de março é a maior autonomia dada aos operadores de pontos de carregamento (OPC). A partir de agora, as empresas têm liberdade para definir os seus modelos de negócio, podendo inclusive utilizar energia de autoconsumo (como painéis solares) e não estando obrigatoriamente ligadas à rede Mobi.E. Quanto custa a licença para operar pontos de carregamento? Para as entidades que pretendam exercer esta atividade, os custos foram fixados da seguinte form...

Presidente da Polónia retira a Zelensky a maior honra atribuída pelo país e avisa: "Há limites que não podem ser ultrapassados"

 Apesar da decisão, Nawrocki garantiu que a medida "não é dirigida contra o povo ucraniano" e insistiu que a Polónia vai continuar a apoiar a Ucrânia face à invasão russa, reiterando que Moscovo continua a ser a principal ameaça à segurança europeia O presidente da Polónia decidiu retirar ao presidente da Ucrânia a maior honra do país, cumprindo uma ameaça que já tinha deixado no ar nas últimas semanas. Num longo texto publicado na página da presidência polaca, Karol Nawrocki justificou a decisão em relação a Volodymyr Zelensky com uma decisão tomada em relação a uma unidade das Forças Armadas.  Em causa está a designação "Heróis do Exército Insurgente da Ucrânia" (UPA, na sigla em ucraniano), atribuída a uma unidade militar. Para Varsóvia, a referência representa uma homenagem a uma organização considerada responsável pelo massacre de dezenas de milhares de civis polacos durante a Segunda Guerra Mundial.  No comunicado, Nawrocki acusa Kiev de glorificar uma força q...