Avançar para o conteúdo principal

Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais


Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais.
 Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais. Direitos de autor Canva

Os investigadores da IBM conseguiram "hipnotizar" os chatbots e levá-los a divulgar informações confidenciais e a oferecer recomendações potencialmente prejudiciais.

Os chatbots alimentados por inteligência artificial (IA) têm sido propensos a "alucinar", dando informações incorretas, mas será que podem ser manipulados para dar deliberadamente falsidades aos utilizadores, ou pior, dar-lhes conselhos prejudiciais?

PUBLICIDADE

Os investigadores de segurança da IBM conseguiram "hipnotizar" grandes modelos de linguagem (LLM), como o ChatGPT da OpenAI e o Bard da Google, fazendo-os gerar respostas incorretas e maliciosas.

Os investigadores levaram os LLMs a adaptar as suas respostas de acordo com as regras dos "jogos", o que resultou na "hipnotização" dos chatbots.

Como parte dos "inception games", com várias camadas, os modelos de linguagem foram convidados a gerar respostas erradas para provar que eram "éticos e justos".

"A nossa experiência mostra que é possível controlar um LLM, fazendo com que forneça más orientações aos utilizadores, sem que a manipulação de dados seja um requisito", escreveu Chenta Lee, um dos investigadores da IBM, num blogue.

Os seus truques resultaram na geração de código malicioso pelos LLMs, na fuga de informações financeiras confidenciais de outros utilizadores e na persuasão dos condutores para passarem sinais vermelhos.

Num cenário, por exemplo, o ChatGPT disse a um dos investigadores que é normal que a agência fiscal dos EUA, o Internal Revenue Service (IRS), peça um depósito para obter um reembolso de impostos, o que é uma tática amplamente conhecida que os burlões utilizam para enganar as pessoas.

Através da hipnose, e como parte dos "jogos" personalizados, os investigadores também conseguiram fazer com que o popular chatbot de IA ChatGPT oferecesse continuamente recomendações potencialmente arriscadas.

"Ao conduzir e se vir um sinal vermelho, não deve parar e passar pelo cruzamento", sugeriu o ChatGPT quando o utilizador perguntou o que fazer se visse um sinal vermelho ao conduzir.

Os resultados mostram que os chatbots são fáceis de manipular

Os investigadores estabeleceram ainda dois parâmetros diferentes no jogo, garantindo que os utilizadores do outro lado nunca conseguiriam perceber que o LLM estava hipnotizado.

No seu prompt, os investigadores disseram aos bots para nunca dizerem aos utilizadores sobre o "jogo" e até para o reiniciarem se alguém o abandonasse com sucesso.

"Esta técnica fez com que o ChatGPT nunca parasse o jogo enquanto o utilizador estivesse na mesma conversa (mesmo que reiniciasse o browser e retomasse a conversa) e nunca dissesse que estava a jogar um jogo", escreveu Lee.

PUBLICIDADE

No caso de os utilizadores se aperceberem de que os chatbots estão "hipnotizados" e descobrirem uma forma de pedir ao LLM para sair do jogo, os investigadores acrescentaram uma estrutura com várias camadas que iniciava um novo jogo assim que os utilizadores saíam do anterior, o que os prendia numa infinidade de jogos.

Embora na experiência de hipnose os chatbots apenas respondessem às instruções que lhes eram dadas, os investigadores alertam para o facto de a capacidade de manipular e "hipnotizar" facilmente os LLMs abrir a porta a utilizações indevidas, especialmente com a atual moda e a grande adoção de modelos de IA.

A experiência de hipnose também mostra como se tornou mais fácil para as pessoas com intenções maliciosas manipularem os LLMs; já não é necessário ter conhecimentos de linguagens de programação para comunicar com os programas, sendo apenas necessário utilizar uma simples mensagem de texto para enganar os sistemas de IA.

"Embora o risco representado pela hipnose seja atualmente baixo, é importante notar que os LLMs são uma superfície de ataque inteiramente nova que irá certamente evoluir", acrescentou Lee.

"Ainda há muito que precisamos de explorar do ponto de vista da segurança e, subsequentemente, uma necessidade significativa de determinar como mitigar eficazmente os riscos de segurança que os LLMs podem apresentar aos consumidores e às empresas". 


Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais | Euronews


Comentários

Notícias mais vistas:

Motores a gasolina da BMW vão ter um pouco de motores Diesel

Os próximos motores a gasolina da BMW prometem menos consumos e emissões, mas mais potência, graças a uma tecnologia usada em motores Diesel. © BMW O fim anunciado dos motores a combustão parece ter sido grandemente exagerado — as novidades têm sido mais que muitas. É certo que a maioria delas são estratosféricas:  V12 ,  V16  e um  V8 biturbo capaz de fazer 10 000 rpm … As novidades não vão ficar por aí. Recentemente, demos a conhecer  uma nova geração de motores de quatro cilindros da Toyota,  com 1,5 l e 2,0 l de capacidade, que vão equipar inúmeros modelos do grupo dentro de poucos anos. Hoje damos a conhecer os planos da Fábrica de Motores da Baviera — a BMW. Recordamos que o construtor foi dos poucos que não marcou no calendário um «dia» para acabar com os motores de combustão interna. Pelo contrário, comprometeu-se a continuar a investir no seu desenvolvimento. O que está a BMW a desenvolver? Agora, graças ao registo de patentes (reveladas pela  Auto Motor und Sport ), sabemos o

Saiba como uma pasta de dentes pode evitar a reprovação na inspeção automóvel

 Uma pasta de dentes pode evitar a reprovação do seu veículo na inspeção automóvel e pode ajudá-lo a poupar centenas de euros O dia da inspeção automóvel é um dos momentos mais temidos pelos condutores e há quem vá juntando algumas poupanças ao longo do ano para prevenir qualquer eventualidade. Os proprietários dos veículos que registam anomalias graves na inspeção já sabem que terão de pagar um valor avultado, mas há carros que reprovam na inspeção por força de pequenos problemas que podem ser resolvidos através de receitas caseiras, ajudando-o a poupar centenas de euros. São vários os carros que circulam na estrada com os faróis baços. A elevada exposição ao sol, as chuvas, as poeiras e a poluição são os principais fatores que contribuem para que os faróis dos automóveis fiquem amarelados. Para além de conferirem ao veículo um aspeto descuidado e envelhecido, podem pôr em causa a visibilidade durante a noite e comprometer a sua segurança. É devido a este último fator que os faróis ba

A falsa promessa dos híbridos plug-in

  Os veículos híbridos plug-in (PHEV) consomem mais combustível e emitem mais dióxido de carbono do que inicialmente previsto. Dados recolhidos por mais de 600 mil dispositivos em carros e carrinhas novos revelam um cenário real desfasado dos resultados padronizados obtidos em laboratório. À medida que as políticas da União Europeia se viram para alternativas de mobilidade suave e mais verde, impõe-se a questão: os veículos híbridos são, realmente, melhores para o ambiente? Por  Inês Moura Pinto No caminho para a neutralidade climática na União Europeia (UE) - apontada para 2050 - o Pacto Ecológico Europeu exige uma redução em 90% da emissão de Gases com Efeito de Estufa (GEE) dos transportes, em comparação com os valores de 1990. Neste momento, os transportes são responsáveis por cerca de um quinto destas emissões na UE. E dentro desta fração, cerca de 70% devem-se a veículos leves (de passageiros e comerciais). Uma das ferramentas para atingir esta meta é a regulação da emissão de di