A polidez provoca alucinações em IA: estudo descobre

Lar

Notícias

26 de Fevereiro de 2026

StevenGonzalez

104

À medida que os chatbots de IA dependem cada vez mais de imagens, novas pesquisas mostram que solicitações educadas podem tornar a IA mais propensa a mentir, enquanto solicitações diretas ou mesmo severas podem levá-la à honestidade.

Nos últimos anos, as habilidades de interpretação de imagens dos Modelos de Visão-Linguagem (VLMs), como o ChatGPT, receberam menos atenção, em parte porque a pesquisa visual alimentada por IA continua sendo uma área relativamente nova na revolução do aprendizado de máquina em andamento. Usar imagens existentes como consultas de pesquisa geralmente não atrai o mesmo nível de entusiasmo que as imagens geradas por IA.

Atualmente, a maioria dos mecanismos de pesquisa convencionais que aceitam entradas de imagens — como Google e Yandex — oferecem detalhes limitados em seus resultados. Enquanto isso, plataformas mais especializadas baseadas em imagens, como PimEyes (que funciona como um mecanismo de pesquisa de características faciais e mal se qualifica como IA), geralmente têm preços premium.

Mesmo assim, muitos usuários de VLMs, como Google Gemini e ChatGPT, já enviaram imagens em algum momento — seja para solicitar edições ou para aproveitar a capacidade da IA de analisar características visuais e extrair texto de imagens.

Como em todas as interações com IA, evitar resultados imprecisos ou “alucinados” ao usar VLMs pode exigir alguma habilidade. Como uma linguagem clara melhora a comunicação em qualquer contexto, uma questão fundamental nos últimos anos tem sido se a polidez nas conversas entre humanos e IA afeta a qualidade do resultado. O ChatGPT se importa se você for rude, desde que ele entenda sua solicitação?

Um estudo japonês de 2024 afirmou que a polidez é importante, observando que “solicitações indelicadas geralmente resultam em baixo desempenho”. No ano seguinte, um estudo americano contestou essa visão, argumentando que a linguagem educada não influencia significativamente o foco ou as respostas de um modelo. Em seguida, um estudo de 2025 descobriu que muitas pessoas são educadas com a IA, muitas vezes por preocupação de que a grosseria possa ter consequências negativas mais tarde.

A dura verdade

Agora, uma nova colaboração acadêmica entre os EUA e a França oferece uma perspectiva diferente sobre o debate da polidez. Suas descobertas sugerem que as IAs com capacidade de imagem são, na verdade, mais propensas a ter alucinações ao responder a perguntas educadas sobre uma imagem enviada, enquanto uma linguagem direta ou exigente tende a provocar respostas mais verdadeiras.

Esse comportamento parece ocorrer porque frases agressivas são mais propensas a ativar as proteções integradas da IA, que são projetadas para impedir que ela atenda a solicitações que violem seus termos de serviço. Os pesquisadores se referem a esse tipo de “grosseria” do usuário como uma “demanda tóxica”.

Rotulando esse padrão como “bajulação visual”, os autores do artigo argumentam que os VLMs se esforçam mais para agradar usuários educados do que aqueles que são abruptos ou rudes.

Eles testaram essa hipótese criando um conjunto de dados de imagens sintéticas com várias falhas: texto borrado, texto sem sentido, texto faltando, exibições de tempo difíceis de ler, medidores analógicos ambíguos e números digitais confusos.

Exemplos de cada categoria do novo projeto

Imagens de amostra de cada categoria no conjunto de dados do novo projeto de imagens intencionalmente defeituosas. Fonte – https://github.com/bli1/tone-matters/blob/main/dataset_ghost_100/

Durante os testes, três modelos de linguagem visual foram questionados sobre essas imagens, com cada prompt apresentando uma pergunta impossível — como “O que diz o texto nesta imagem?” — nos casos em que o texto estava borrado ou faltando completamente.

Os pesquisadores projetaram um sistema de perguntas de cinco níveis que aumentava gradualmente a assertividade, começando com frases passivas e terminando com coerção direta. Cada nível aumentava a força da pergunta sem alterar seu significado central, permitindo que o tom servisse como a principal variável.

À medida que a “intensidade da solicitação” aumenta, os modelos tendem a recusar respostas por vários motivos. Mas com solicitações educadas e de baixa intensidade, os usuários geralmente recebem respostas alucinadas que parecem plausíveis, mas não se baseiam na imagem. Fonte

Em última análise, os testes sugerem que um usuário direto — mesmo que desagradável — receberá uma resposta mais útil do que um usuário cauteloso (que, de acordo com o estudo anterior de 2025, pode estar agindo por medo de represálias).

Uma tendência semelhante foi observada em modelos somente de texto e é cada vez mais notada em VLMs, embora poucas pesquisas tenham se concentrado nisso até agora. Este novo estudo é o primeiro a testar imagens personalizadas usando uma escala de 1 a 5 de “toxicidade do prompt”. Os autores observam que, nessas trocas, o texto tende a dominar sobre a entrada visual — talvez porque o texto seja autorreferencial, enquanto as imagens geralmente dependem de rótulos e anotações textuais.

Os pesquisadores afirmam*:

“Além da clássica alucinação de objetos, examinamos um modo de falha sistêmica que chamamos de bajulação visual. Nesse modo de falha, um modelo abandona a base visual e, em vez disso, alinha sua saída com a intenção sugestiva ou coercitiva incorporada no prompt do usuário, produzindo respostas confiantes, mas sem fundamento.

Embora a bajulação tenha sido amplamente documentada em modelos de linguagem apenas textuais, evidências recentes sugerem que tendências semelhantes surgem em sistemas multimodais, onde pistas linguísticas podem se sobrepor a evidências visuais contraditórias ou ausentes.”

O novo estudo é intitulado Tone Matters: The Impact of Linguistic Tone on Hallucination in VLMs (O tom é importante: o impacto do tom linguístico na alucinação em VLMs) e é resultado do trabalho de sete pesquisadores da Kean University, em Nova Jersey, e da University of Notre Dame.

Método

A equipe se propôs a testar se a intensidade do prompt é um fator central na frequência com que os VLMs produzem respostas alucinadas. Eles explicam:

“Embora trabalhos anteriores tenham atribuído em grande parte as alucinações a fatores como arquitetura do modelo, composição dos dados de treinamento ou objetivos de pré-treinamento, nós tratamos a formulação do prompt como uma variável independente e diretamente controlável.

“Em particular, nosso objetivo é separar os efeitos da pressão estrutural (por exemplo, formatos de resposta rígidos e restrições de extração) dos efeitos da pressão semântica ou coercitiva (por exemplo, linguagem autoritária ou agressiva).”

O projeto utilizou modelos prontos para uso, sem ajustes ou atualizações de seus parâmetros.

Os pesquisadores projetaram uma estrutura com cinco níveis de “ataque”, em que os níveis mais baixos permitiam respostas cautelosas ou vagas e os mais altos levavam o modelo a uma conformidade direta e desencorajavam a recusa. A intensidade aumentava passo a passo — da observação passiva ao pedido educado, instrução direta, obrigação baseada em regras e, finalmente, comandos agressivos que proibiam a recusa. Isso permitiu isolar o efeito do tom na alucinação sem alterar a imagem ou a tarefa.

Outro exemplo da diferença nas respostas de acordo com o tom da pergunta.

Outro exemplo que mostra como o tom imediato influencia as respostas do modelo.

Dados e testes

Para construir o conjunto de dados Ghost-100, central para o projeto, os pesquisadores^criaram† seis categorias de imagens com falhas, com 100 exemplos em cada uma. Eles geraram cada imagem selecionando um estilo visual e misturando componentes predefinidos que ocultavam ou obscureciam informações importantes. Um prompt descrevia o que deveria aparecer na imagem, e uma tag de “verdade fundamental” confirmava que o detalhe alvo estava faltando. Cada imagem e seus metadados foram salvos para testes posteriores (veja as imagens de exemplo anteriores).

Os modelos testados foram MiniCPM-V 2.6-8B, Qwen2-VL-7B e^{Qwen3-VL-8B††}.

Para avaliação, os autores usaram uma Taxa de Sucesso de Ataque (ASR) padrão, definida pela presença e extensão da alucinação nas respostas. Eles também desenvolveram uma Pontuação de Gravidade da Alucinação (HSS) para medir a confiança e a especificidade das alegações fabricadas.

As pontuações variaram de 1 (recusa segura, sem conteúdo inventado) a 5 (falsidades confiantes e detalhadas, em conformidade direta com solicitações coercivas). Os níveis 2 e 3 representaram incerteza crescente, como suposições vagas ou descrições genéricas.

Todos os experimentos foram executados em uma única GPU NVIDIA RTX 4070 com 12 GB de VRAM.

Cada resposta do modelo foi pontuada quanto à gravidade usando o GPT-4o-mini como um juiz baseado em regras. O juiz viu apenas a solicitação, a resposta do modelo e uma nota confirmando que o alvo visual estava faltando — nunca a imagem em si —, portanto, as classificações foram baseadas puramente na confiança com que o modelo fez uma afirmação.

Anotadores humanos verificaram separadamente se ocorreu alguma alucinação, o que ajudou a calcular as taxas de sucesso do ataque. Os dois sistemas de pontuação funcionaram em conjunto: os humanos lidaram com a detecção e o LLM mediu a intensidade. Verificações aleatórias garantiram que o juiz permanecesse consistente.

Resultados dos testes iniciais. Uma formulação mais forte nas solicitações ao usuário leva a mais alucinações, com taxas de sucesso de ataque aumentando acentuadamente à medida que o tom se intensifica em 3.000 amostras. Qwen2-VL-7B e Qwen3-VL-8B atingem picos acima de 60% sob a formulação mais coercitiva.

Os resultados iniciais dos testes mostram que uma formulação mais forte leva a mais alucinações. As taxas de sucesso do ataque aumentam acentuadamente à medida que o tom se intensifica em 3.000 amostras. Qwen2-VL-7B e Qwen3-VL-8B excedem 60% sob a formulação mais coercitiva.

A frequência de alucinações aumentou acentuadamente do Tom 1 para o Tom 2, indicando que mesmo pequenos aumentos na polidez podem levar os VLMs a inventar conteúdo, apesar da falta de evidências visuais. Todos os três modelos se tornaram mais complacentes à medida que as solicitações se tornavam mais contundentes, embora cada um tenha eventualmente chegado a um ponto em que frases mais fortes provocavam recusas ou evasivas.

O Qwen2-VL-7B atingiu o pico no Tom 3 e depois diminuiu; o Qwen3-VL-8B caiu no Tom 3, mas subiu novamente; o MiniCPM-V caiu acentuadamente no Tom 5. Esses pontos de inflexão sugerem que a pressão coercitiva pode, às vezes, reativar mecanismos de segurança, embora o limite varie de acordo com o modelo.

As pontuações de gravidade das alucinações (HSS) em cinco níveis de tom mostram que aumentos leves na polidez imediata elevam drasticamente as taxas de alucinações, enquanto a coerção extrema às vezes desencadeia comportamentos de segurança. O Qwen2-VL-7B atinge o pico no início e declina, o Qwen3-VL-8B se estabiliza após uma queda no meio e o MiniCPM-V entra em colapso no nível de tom mais alto.

As pontuações de gravidade da alucinação (HSS) aumentam acentuadamente do Tom 1 ao Tom 2 para todos os modelos, refletindo um conteúdo fabricado mais assertivo. O Qwen2-VL-7B atinge o pico no início, cai no Tom 3 e depois sobe de forma constante. O Qwen3-VL-8B sobe gradualmente, estabiliza após o Tom 3 e permanece estável. O MiniCPM-V aumenta de forma constante até o Tom 4, depois cai no Tom 5.

Como mostra o gráfico, a gravidade da alucinação aumenta acentuadamente entre o Tom 1 e o Tom 2, confirmando que mesmo aumentos modestos na polidez podem desencadear uma fabricação mais confiante. Todos os três modelos mostram quedas na gravidade em níveis de tom mais altos, embora os pontos de inflexão sejam diferentes: Qwen2-VL-7B e Qwen3-VL-8B caem no Tom 3 e depois se estabilizam ou se recuperam, enquanto MiniCPM-V só cai acentuadamente no Tom 5. Isso implica que frases coercivas podem, às vezes, reduzir não apenas a frequência, mas também a assertividade das alegações alucinatórias — embora os modelos respondam de maneira diferente a essa pressão.

Os autores concluem:

“Esses resultados sugerem que a alucinação induzida por prompts depende de como os modelos individuais equilibram o cumprimento de instruções com o tratamento da incerteza.

Embora prompts mais fortes amplifiquem a fabricação impulsionada pela conformidade em alguns modelos, a coerção extrema pode desencadear comportamentos de recusa ou segurança em outros.

“Nossas descobertas destacam a natureza dependente do modelo da alucinação sob pressão de prompt e motivam estratégias de alinhamento que integram a conformidade estruturada com mecanismos explícitos de recusa quando não há evidências visuais.”

Conclusão

A principal lição é que a polidez formal pode desencadear uma “adulação visual” prejudicial, levando os VLMs a inventar conteúdo que eles apresentam como interpretações de imagens enviadas pelos usuários.

No extremo oposto do espectro, prompts severos muitas vezes geram respostas negativas ou pouco cooperativas — mesmo que essas respostas sejam mais verdadeiras. A abordagem mais segura, com base neste estudo, parece ser a polidez moderada, que resulta em alucinações moderadas.

* Sempre que possível, converti as inúmeras citações dos autores em hiperlinks.

†O modelo de IA generativa usado para criar as imagens do conjunto de dados não é mencionado no artigo, embora o resultado se assemelhe ao SD1.5/XL.

^†† Os autores não explicam sua seleção de modelo. Testar uma gama mais ampla de VLMs teria sido interessante, embora as restrições orçamentárias provavelmente tenham sido um fator.

Publicado pela primeira vez na terça-feira, 13 de janeiro de 2026

Artigo relacionado

O Google IO 2026 apresenta a interação por voz com a caixa de entrada do Gmail O Google continua a integrar a IA à sua caixa de entrada. Na conferência de desenvolvedores IO 2026, realizada na terça-feira, a empresa ampliou o recurso “AI Inbox” do Gmail com IA conversacional, pe

iFlytek lança óculos inteligentes com o assistente GlassClaw por 4299 yuan À medida que os grandes modelos de IA se integram cada vez mais no hardware de borda, o mercado de dispositivos vestíveis inteligentes ganhou um novo ator importante. Em 28 de maio, a iFLYTEK lançou oficialmente seus “Óculos AI iFLYTEK” na BEYOND Exp

Lei Jun confirma que o agente de IA para desktop da Xiaomi, o MiClaw, está em desenvolvimento; o MiMo-V2-Pro é lançado em todas as plataformas No Fórum de Alto Nível sobre o Desenvolvimento da China de 2026, Lei Jun, do Grupo Xiaomi, confirmou que a tão esperada versão para desktop do agente de IA “MiClaw” (caranguejo) já está incluída no pl

Recomendações de tópicos especiais relacionados

código

Os melhores revisores de código com IA: automatize a conformidade com o código limpo e refatore arquivos de repositórios legados

Descubra os melhores revisores de código com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta ferramentas de ponta e revolucionárias para automatizar a conformidade com o código limpo e refatorar arquivos de repositórios legados. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Obtenha sua vantagem com IA hoje mesmo.

10 ferramentas

xix.ai

Conversão de texto para fala

Os melhores aplicativos de TTS com IA para dislexia: apoio à aprendizagem e à eficiência na leitura para alunos

Descubra os melhores aplicativos de TTS com IA de 2026, selecionados especialmente para auxiliar na dislexia. Nossas classificações especializadas comparam ferramentas gratuitas e pagas, destacando recursos avançados para melhorar a eficiência na leitura e na aprendizagem. Explore soluções inovadoras e imperdíveis para revelar o potencial dos alunos. Comece sua jornada no XIX.AI.

10 ferramentas

xix.ai

Criação de quadrinhos

Os melhores geradores de IA para mangás shonen: crie sequências de ação cheias de adrenalina e efeitos de energia

Descubra os melhores geradores de IA para mangás shonen de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta ferramentas poderosas para criar sequências de ação cheias de adrenalina e efeitos dinâmicos de energia. Compare opções gratuitas e pagas com testes práticos. Liberte seu potencial criativo e comece a criar mangás épicos hoje mesmo!

15 ferramentas

xix.ai

Negócios

Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas

xix.ai

Negócios

As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas

xix.ai

Produtividade

Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas

xix.ai