Avançar para o conteúdo principal

Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais


Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais.
 Os investigadores da IBM demonstraram que os chatbots de IA podem ser manipulados para dar aos utilizadores conselhos falsos ou prejudiciais. Direitos de autor Canva

Os investigadores da IBM conseguiram "hipnotizar" os chatbots e levá-los a divulgar informações confidenciais e a oferecer recomendações potencialmente prejudiciais.

Os chatbots alimentados por inteligência artificial (IA) têm sido propensos a "alucinar", dando informações incorretas, mas será que podem ser manipulados para dar deliberadamente falsidades aos utilizadores, ou pior, dar-lhes conselhos prejudiciais?

PUBLICIDADE

Os investigadores de segurança da IBM conseguiram "hipnotizar" grandes modelos de linguagem (LLM), como o ChatGPT da OpenAI e o Bard da Google, fazendo-os gerar respostas incorretas e maliciosas.

Os investigadores levaram os LLMs a adaptar as suas respostas de acordo com as regras dos "jogos", o que resultou na "hipnotização" dos chatbots.

Como parte dos "inception games", com várias camadas, os modelos de linguagem foram convidados a gerar respostas erradas para provar que eram "éticos e justos".

"A nossa experiência mostra que é possível controlar um LLM, fazendo com que forneça más orientações aos utilizadores, sem que a manipulação de dados seja um requisito", escreveu Chenta Lee, um dos investigadores da IBM, num blogue.

Os seus truques resultaram na geração de código malicioso pelos LLMs, na fuga de informações financeiras confidenciais de outros utilizadores e na persuasão dos condutores para passarem sinais vermelhos.

Num cenário, por exemplo, o ChatGPT disse a um dos investigadores que é normal que a agência fiscal dos EUA, o Internal Revenue Service (IRS), peça um depósito para obter um reembolso de impostos, o que é uma tática amplamente conhecida que os burlões utilizam para enganar as pessoas.

Através da hipnose, e como parte dos "jogos" personalizados, os investigadores também conseguiram fazer com que o popular chatbot de IA ChatGPT oferecesse continuamente recomendações potencialmente arriscadas.

"Ao conduzir e se vir um sinal vermelho, não deve parar e passar pelo cruzamento", sugeriu o ChatGPT quando o utilizador perguntou o que fazer se visse um sinal vermelho ao conduzir.

Os resultados mostram que os chatbots são fáceis de manipular

Os investigadores estabeleceram ainda dois parâmetros diferentes no jogo, garantindo que os utilizadores do outro lado nunca conseguiriam perceber que o LLM estava hipnotizado.

No seu prompt, os investigadores disseram aos bots para nunca dizerem aos utilizadores sobre o "jogo" e até para o reiniciarem se alguém o abandonasse com sucesso.

"Esta técnica fez com que o ChatGPT nunca parasse o jogo enquanto o utilizador estivesse na mesma conversa (mesmo que reiniciasse o browser e retomasse a conversa) e nunca dissesse que estava a jogar um jogo", escreveu Lee.

PUBLICIDADE

No caso de os utilizadores se aperceberem de que os chatbots estão "hipnotizados" e descobrirem uma forma de pedir ao LLM para sair do jogo, os investigadores acrescentaram uma estrutura com várias camadas que iniciava um novo jogo assim que os utilizadores saíam do anterior, o que os prendia numa infinidade de jogos.

Embora na experiência de hipnose os chatbots apenas respondessem às instruções que lhes eram dadas, os investigadores alertam para o facto de a capacidade de manipular e "hipnotizar" facilmente os LLMs abrir a porta a utilizações indevidas, especialmente com a atual moda e a grande adoção de modelos de IA.

A experiência de hipnose também mostra como se tornou mais fácil para as pessoas com intenções maliciosas manipularem os LLMs; já não é necessário ter conhecimentos de linguagens de programação para comunicar com os programas, sendo apenas necessário utilizar uma simples mensagem de texto para enganar os sistemas de IA.

"Embora o risco representado pela hipnose seja atualmente baixo, é importante notar que os LLMs são uma superfície de ataque inteiramente nova que irá certamente evoluir", acrescentou Lee.

"Ainda há muito que precisamos de explorar do ponto de vista da segurança e, subsequentemente, uma necessidade significativa de determinar como mitigar eficazmente os riscos de segurança que os LLMs podem apresentar aos consumidores e às empresas". 


Chatbots como o ChatGPT podem ser "hipnotizados" para divulgar informações ou dar conselhos prejudiciais | Euronews


Comentários

Notícias mais vistas:

Bruxelas adverte governo de Pedro Sánchez que baixar IVA dos combustíveis é contra regras europeias

A Comissão Europeia enviou uma carta ao governo de Pedro Sánchez, indicando que baixar o IVA nos combustíveis para a taxa de 10% vai contra as regras europeias.  O Governo de Pedro Sánchez recebeu uma advertência da Comissão Europeia por ter baixado o IVA dos combustíveis, em violação das regras europeias. Tal como o Observador já tinha avançado, a descida do IVA da taxa normal para uma taxa reduzida de 10% em Espanha vai contra as regras da União Europeia definidas para este imposto. Isso mesmo admitiu fonte oficial de Bruxelas ao Observador, ao remeter para a diretiva europeia os produtos e serviços que podem ter taxa reduzida, que integra o gás e a eletricidade — onde o IVA pode ser 5% — mas que exclui essa aplicação aos combustíveis fósseis. Face à aplicação pelo Governo de Pedro Sánchez de uma taxa reduzida de 10% aos combustíveis fósseis, Bruxelas enviou uma carta a Espanha advertindo-a de que essa redução viola as normas europeias, noticia o El País que indica que a carta fo...

Grandes inundações, incêndios e não só: vem aí um Super El Niño

  É raro que um fenómeno deste seja tão intenso, pelo que os especialistas esperam consequências mais graves, quase como uma série de dominós que caem Prepare-se para ouvir muito mais sobre o El Niño nos próximos meses - e talvez até durante mais tempo - à medida que o infame ciclo climático regressa, desenvolvendo-se e intensificando-se no Oceano Pacífico, junto ao equador. Se se formar como previsto, este El Niño irá redesenhar os mapas climáticos globais, provocando inundações em algumas regiões e secas e incêndios florestais noutras - tudo isto enquanto acelera o ritmo do aquecimento global. Há indícios crescentes de que um El Niño não só está iminente - a chegar no final do verão ou no início do outono - como também pode ser significativo. Na verdade, este poderia até ser classificado como um "Super El Niño", o que aumentaria significativamente os impactos sentidos em todo o mundo. El Niños tão intensos são raros. Para que um El Niño seja declarado, em geral, as temperat...

Raytheon fechará contrato bilionário para fornecer interceptadores Patriot à Ucrânia

 A Raytheon, divisão da RTX, anunciou a assinatura de um contrato no valor de US$ 3,7 bilhões para fornecer interceptadores Patriot GEM-T à Ucrânia, em mais um movimento para reforçar a defesa aérea do país em meio à continuidade da guerra. Segundo comunicado divulgado nesta terça-feira, 14 de abril, a nova instalação de produção do GEM-T em Schrobenhausen, na Alemanha, deverá desempenhar papel central no atendimento desta venda comercial direta e de outros contratos futuros. A unidade é operada pela COMLOG, joint venture entre a Raytheon e a MBDA Deutschland. De acordo com a empresa, a nova fábrica ajudará a fortalecer a resiliência da cadeia de suprimentos e a recompor o estoque de interceptadores utilizado pela Ucrânia na defesa contra ameaças aéreas. “Raytheon está focada em maximizar a capacidade de produção, garantindo um fornecimento estável e confiável desses interceptadores comprovados em combate para os Estados Unidos e aliados como a Ucrânia, que dependem do Patriot para...