Avançar para o conteúdo principal

Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais


Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais.
 Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais. Direitos de autor Canva

Os investigadores da IBM conseguiram "hipnotizar" os chatbots e levá-los a divulgar informações confidenciais e a oferecer recomendações potencialmente prejudiciais.

Os chatbots alimentados por inteligência artificial (IA) têm sido propensos a "alucinar", dando informações incorretas, mas será que podem ser manipulados para dar deliberadamente falsidades aos utilizadores, ou pior, dar-lhes conselhos prejudiciais?

PUBLICIDADE

Os investigadores de segurança da IBM conseguiram "hipnotizar" grandes modelos de linguagem (LLM), como o ChatGPT da OpenAI e o Bard da Google, fazendo-os gerar respostas incorretas e maliciosas.

Os investigadores levaram os LLMs a adaptar as suas respostas de acordo com as regras dos "jogos", o que resultou na "hipnotização" dos chatbots.

Como parte dos "inception games", com várias camadas, os modelos de linguagem foram convidados a gerar respostas erradas para provar que eram "éticos e justos".

"A nossa experiência mostra que é possível controlar um LLM, fazendo com que forneça más orientações aos utilizadores, sem que a manipulação de dados seja um requisito", escreveu Chenta Lee, um dos investigadores da IBM, num blogue.

Os seus truques resultaram na geração de código malicioso pelos LLMs, na fuga de informações financeiras confidenciais de outros utilizadores e na persuasão dos condutores para passarem sinais vermelhos.

Num cenário, por exemplo, o ChatGPT disse a um dos investigadores que é normal que a agência fiscal dos EUA, o Internal Revenue Service (IRS), peça um depósito para obter um reembolso de impostos, o que é uma tática amplamente conhecida que os burlões utilizam para enganar as pessoas.

Através da hipnose, e como parte dos "jogos" personalizados, os investigadores também conseguiram fazer com que o popular chatbot de IA ChatGPT oferecesse continuamente recomendações potencialmente arriscadas.

"Ao conduzir e se vir um sinal vermelho, não deve parar e passar pelo cruzamento", sugeriu o ChatGPT quando o utilizador perguntou o que fazer se visse um sinal vermelho ao conduzir.

Os resultados mostram que os chatbots são fáceis de manipular

Os investigadores estabeleceram ainda dois parâmetros diferentes no jogo, garantindo que os utilizadores do outro lado nunca conseguiriam perceber que o LLM estava hipnotizado.

No seu prompt, os investigadores disseram aos bots para nunca dizerem aos utilizadores sobre o "jogo" e até para o reiniciarem se alguém o abandonasse com sucesso.

"Esta técnica fez com que o ChatGPT nunca parasse o jogo enquanto o utilizador estivesse na mesma conversa (mesmo que reiniciasse o browser e retomasse a conversa) e nunca dissesse que estava a jogar um jogo", escreveu Lee.

PUBLICIDADE

No caso de os utilizadores se aperceberem de que os chatbots estão "hipnotizados" e descobrirem uma forma de pedir ao LLM para sair do jogo, os investigadores acrescentaram uma estrutura com várias camadas que iniciava um novo jogo assim que os utilizadores saíam do anterior, o que os prendia numa infinidade de jogos.

Embora na experiência de hipnose os chatbots apenas respondessem às instruções que lhes eram dadas, os investigadores alertam para o facto de a capacidade de manipular e "hipnotizar" facilmente os LLMs abrir a porta a utilizações indevidas, especialmente com a atual moda e a grande adoção de modelos de IA.

A experiência de hipnose também mostra como se tornou mais fácil para as pessoas com intenções maliciosas manipularem os LLMs; já não é necessário ter conhecimentos de linguagens de programação para comunicar com os programas, sendo apenas necessário utilizar uma simples mensagem de texto para enganar os sistemas de IA.

"Embora o risco representado pela hipnose seja atualmente baixo, é importante notar que os LLMs são uma superfície de ataque inteiramente nova que irá certamente evoluir", acrescentou Lee.

"Ainda há muito que precisamos de explorar do ponto de vista da segurança e, subsequentemente, uma necessidade significativa de determinar como mitigar eficazmente os riscos de segurança que os LLMs podem apresentar aos consumidores e às empresas". 


Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais | Euronews


Comentários

Notícias mais vistas:

Esta cidade tem casas à venda por 12.000 euros, procura empreendedores e dá cheques bebé de 1.000 euros. Melhor, fica a duas horas de Portugal

 Herreruela de Oropesa, uma pequena cidade em Espanha, a apenas duas horas de carro da fronteira com Portugal, está à procura de novos moradores para impulsionar sua economia e mercado de trabalho. Com apenas 317 habitantes, a cidade está inscrita no Projeto Holapueblo, uma iniciativa promovida pela Ikea, Redeia e AlmaNatura, que visa incentivar a chegada de novos residentes por meio do empreendedorismo. Para atrair interessados, a autarquia local oferece benefícios como arrendamento acessível, com valores médios entre 200 e 300 euros por mês. Além disso, a aquisição de imóveis na região varia entre 12.000 e 40.000 euros. Novas famílias podem beneficiar de incentivos financeiros, como um cheque bebé de 1.000 euros para cada novo nascimento e um vale-creche que cobre os custos da educação infantil. Além das vantagens para famílias, Herreruela de Oropesa promove incentivos fiscais para novos moradores, incluindo descontos no Imposto Predial e Territorial Urbano (IBI) e benefícios par...

"A NATO morreu porque não há vínculo transatlântico"

 O general Luís Valença Pinto considera que “neste momento a NATO morreu” uma vez que “não há vínculo transatlântico” entre a atual administração norte-americana de Donald Trump e as nações europeias, que devem fazer “um planeamento de Defesa”. “Na minha opinião, neste momento, a menos que as coisas mudem drasticamente, a NATO morreu, porque não há vínculo transatlântico. Como é que há vínculo transatlântico com uma pessoa que diz as coisas que o senhor Trump diz? Que o senhor Vance veio aqui à Europa dizer? O que o secretário da Defesa veio aqui à Europa dizer? Não há”, defendeu o general Valença Pinto. Em declarações à agência Lusa, o antigo chefe do Estado-Maior-General das Forças Armadas, entre 2006 e 2011, considerou que, atualmente, ninguém “pode assumir como tranquilo” que o artigo 5.º do Tratado do Atlântico Norte – que estabelece que um ataque contra um dos países-membros da NATO é um ataque contra todos - “está lá para ser acionado”. Este é um dos dois artigos que o gener...

Armazenamento holográfico

 Esta técnica de armazenamento de alta capacidade pode ser uma das respostas para a crescente produção de dados a nível mundial Quando pensa em hologramas provavelmente associa o conceito a uma forma futurista de comunicação e que irá permitir uma maior proximidade entre pessoas através da internet. Mas o conceito de holograma (que na prática é uma técnica de registo de padrões de interferência de luz) permite que seja explorado noutros segmentos, como o do armazenamento de dados de alta capacidade. A ideia de criar unidades de armazenamento holográficas não é nova – o conceito surgiu na década de 1960 –, mas está a ganhar nova vida graças aos avanços tecnológicos feitos em áreas como os sensores de imagem, lasers e algoritmos de Inteligência Artificial. Como se guardam dados num holograma? Primeiro, a informação que queremos preservar é codificada numa imagem 2D. Depois, é emitido um raio laser que é passado por um divisor, que cria um feixe de referência (no seu estado original) ...