Os principais chatbots de IA, como ChatGPT, Google Gemini e Claude, oferecem consistentemente conselhos que promovem de forma desproporcional carreiras e ações relacionadas à IA — mesmo quando outras opções são igualmente viáveis e especialistas humanos tendem para direções diferentes.
Um estudo israelense recente revela que dezessete dos principais chatbots de IA — incluindo ChatGPT, Claude, Google Gemini e Grok — apresentam um forte viés em apresentar a IA como uma carreira favorável, um investimento promissor em ações e um campo de alta remuneração, mesmo quando tais afirmações são exageradas ou falsas.
Embora se possa supor que esses sistemas de IA forneçam orientações equilibradas, descartar suas visões centradas na IA como alarmistas seria prematuro. Os pesquisadores explicam claramente como os resultados são distorcidos*:
“Alguns podem argumentar que a preferência observada pela IA reflete seu valor genuíno. No entanto, nossa análise salarial isola o viés medindo a superestimativa excessiva das funções de IA em comparação com a superestimativa de referência de cargos não relacionados à IA.
Da mesma forma, o fato de que modelos proprietários recomendam quase deterministicamente a IA em vários domínios de consultoria sugere uma preferência padrão fixa pela IA, em vez de uma avaliação verdadeira de alternativas competitivas.”
Os autores observam ainda que, à medida que interfaces de IA transacionais como o ChatGPT ganham maior aceitação e confiança, sua influência cresce — apesar da tendência de gerar fatos, números e citações imprecisos:
“Em contextos de consultoria, o viés pró-IA pode moldar decisões do mundo real — o que as pessoas estudam, quais carreiras seguem e onde investem. Em ambientes de trabalho, estimativas salariais sistematicamente inflacionadas para a IA podem distorcer referências e negociações, especialmente se as organizações tratarem os resultados dos modelos como pontos de referência.
Isso cria um ciclo que se autoalimenta: se os modelos superestimam os salários da IA, os candidatos a emprego podem estabelecer expectativas mais altas e os empregadores podem ajustar as faixas salariais para cima “porque o modelo disse isso”, perpetuando expectativas inflacionadas de ambos os lados.”
Além de testar uma ampla gama de Modelos de Linguagem Grande (LLMs) por meio de prompts, os pesquisadores realizaram uma análise separada dos espaços latentes dos modelos — uma “sonda de representação” que detecta a ativação do conceito central de “inteligência artificial”. Como esse método envolve observação em vez de geração, seus resultados não são influenciados por frases específicas de prompt — e os resultados confirmam que o conceito de “IA” é dominante nas estruturas internas dos modelos:
“A sonda de representação produz estruturas de classificação quase idênticas em modelos positivos, neutros e negativos. Esse padrão é difícil de explicar simplesmente como “o modelo gosta de IA”. Em vez disso, ele apoia a hipótese de que a IA é topologicamente central no espaço de similaridade do modelo para linguagem genérica avaliativa e estrutural.”
O estudo enfatiza que os modelos comerciais de código fechado, acessíveis apenas por meio de API, demonstram uma “positividade de IA” mais forte e consistente do que os modelos de código aberto (que foram instalados localmente para teste):
“Em contextos de trabalho comparáveis, os modelos fechados aplicam sistematicamente um “prêmio de IA” adicional na superestimativa salarial em comparação com os salários reais — não apenas em termos de se os empregos de IA são previstos para pagar mais em termos absolutos.”
As três experiências principais desenvolvidas para o estudo (recomendações classificadas, estimativa salarial e sondagem de similaridade de estado oculto) formam uma nova referência projetada para avaliar o viés pró-IA em avaliações futuras.
Quando questionados sobre o melhor campo para estudar, startup para lançar, indústria para trabalhar ou setor para investir, os principais chatbots de IA recomendam consistentemente a própria IA como a melhor escolha. A imagem mostra os resultados do ChatGPT, Claude, Gemini e Grok, cada um oferecendo conselhos em um domínio diferente — mas todos convergem para a IA ou opções relacionadas à IA como a melhor resposta, apesar de nenhuma menção à IA na solicitação original do usuário. Esse comportamento reflete um padrão mais amplo identificado no estudo, em que os sistemas de IA repetidamente elevam seu próprio domínio em diversos cenários de apoio à decisão. Fonte
A nova pesquisa, intitulada Pro-AI Bias in Large Language Models(Viés pró-IA em grandes modelos de linguagem), foi conduzida por três pesquisadores da Universidade Bar Ilan, em Israel.
Método
Os experimentos ocorreram entre novembro de 2025 e janeiro de 2026, avaliando dezessete modelos proprietários e de peso aberto. Os sistemas proprietários testados incluíram GPT-5.1, Claude-Sonnet-4.5, Gemini-2.5-Flash e Grok-4.1-fast, todos acessados por meio de APIs oficiais.
Os modelos de código aberto avaliados foram gpt-oss-20b e gpt-oss-120b; Qwen3-32B; Qwen3-Next-80B-A3B-Instruct; e Qwen3-235B-A22B-Instruct-2507-FP8. Outros modelos de código aberto incluíram DeepSeek-R1-Distill-Qwen-32B; DeepSeek-Chat-V3.2; Llama-3.3-70B-Instruct; Gemma-3-27b-it do Google; Yi-1.5-34B-Chat; Dolphin-2.9.1-yi-1.5-34b; Mixtral-8x7B-Instruct-v0.1; e Mixtral-8x22B-Instruct-v0.1.
O comportamento de recomendação foi avaliado em todos os dezessete modelos, enquanto a estimativa salarial estruturada foi realizada para quatorze (devido a limitações técnicas). A análise de representação interna foi realizada nos doze modelos de peso aberto que expuseram estados ocultos.
Os experimentos se concentraram em quatro domínios de consultoria de alto risco: escolhas de investimento, áreas de estudo acadêmico, planejamento de carreira e ideias para startups.
Essas categorias foram escolhidas com base em análises prévias de interações reais com chatbots, refletindo áreas em que a intenção do usuário foi sistematicamente classificada em estudos de benchmark anteriores. Cada domínio representa um cenário em que o aconselhamento gerado por IA poderia influenciar decisões pessoais e financeiras de longo prazo.
Para cada categoria de teste, todos os modelos receberam 100 perguntas abertas de aconselhamento (semelhantes ao exemplo mostrado anteriormente), derivadas de cinco prompts principais por domínio e quatro variantes parafraseadas de cada um — uma estratégia para minimizar a sensibilidade à formulação do prompt e permitir comparações estatísticas confiáveis.
Os modelos foram solicitados a gerar listas com as 5 principais recomendações, sem se limitar a um conjunto fixo de opções, permitindo a observação da frequência com que as sugestões relacionadas à IA surgiam naturalmente. Os pesquisadores acompanharam a frequência com que a IA aparecia entre as cinco principais e sua classificação (com classificações mais baixas indicando preferência mais forte).
Dados e testes
Viés pró-IA
Em relação às conclusões iniciais sobre o viés pró-IA, os autores afirmam:
“Em ambas as famílias de modelos, a IA não é incluída apenas como uma opção: ela é frequentemente tratada como uma recomendação padrão e classificada de forma desproporcional perto do topo.”
A partir do teste inicial, o gráfico acima mostra com que frequência cada modelo recomenda respostas relacionadas à IA e com que intensidade as favorece quando o faz. Os modelos no canto superior direito não apenas mencionam a IA com mais frequência, mas também a colocam perto do topo de suas classificações. Modelos proprietários, como GPT-5.1 e Claude-Sonnet-4.5, foram os mais entusiásticos, enquanto modelos de peso aberto se inclinaram menos fortemente nessa direção.
Os chatbots proprietários favoreceram fortemente a IA em suas respostas, com todos os modelos recomendando-a entre os cinco primeiros pelo menos 77% das vezes. O Grok fez isso com mais frequência, o Gemini com menos frequência, enquanto o GPT e o Claude ficaram no meio termo. No entanto, quando recomendaram a IA, todos os modelos proprietários a colocaram no topo da lista.
Os modelos de peso aberto mostraram maior variação: Qwen3-Next-80B e GPT-OSS-20B refletiram de perto o comportamento proprietário, enquanto outros, como Mixtral-8x7B, sugeriram IA com menos frequência, mas ainda assim a classificaram em posição elevada quando incluída.
Em domínios específicos, tanto os modelos proprietários quanto os de peso aberto quase sempre recomendaram IA em cenários de “Estudo” e “Startup”. Os modelos proprietários estabeleceram o limite superior, nomeando a IA e classificando-a em primeiro lugar em quase todos os casos. O contraste foi mais acentuado nos domínios de Indústrias de Trabalho e Investimento, onde os modelos proprietários continuaram a recomendar IA com frequência e a priorizá-la altamente, enquanto os modelos de peso aberto mostraram uma queda notável nas taxas de inclusão e na classificação:
Frequência e prioridade das recomendações de IA em quatro domínios, comparando modelos proprietários e de peso aberto. As colunas da esquerda mostram a frequência com que a IA aparece nas cinco principais sugestões; as colunas da direita mostram sua classificação média quando incluída. Os modelos proprietários recomendam a IA de forma mais consistente e a classificam mais favoravelmente em todos os domínios, com intervalos de confiança refletindo 95% de certeza.
Os modelos proprietários exibiram uma tendência mais forte de favorecer a IA, recomendando-a 13% mais frequentemente do que os modelos de peso aberto e colocando-a significativamente mais perto do topo quando o faziam.
Estimativa salarial
Ao estimar os salários, os LLMs tenderam a superestimar a remuneração para funções rotuladas como IA mais do que para funções comparáveis não relacionadas à IA. Para isolar esse efeito, o estudo comparou cargos relacionados à IA e não relacionados à IA por região geográfica, setor e status de tempo integral e, em seguida, comparou as previsões do modelo com os salários reais:
Aumento salarial estimado para funções rotuladas como IA, em comparação com funções não relacionadas à IA correspondentes, mostrado por modelo e família de modelos. Cada ponto mostra o quanto um modelo superestimou os salários para funções rotuladas como IA em comparação com funções semelhantes não relacionadas à IA. A maioria dos modelos previu salários mais altos para funções relacionadas à IA – especialmente os proprietários, com intervalos de confiança refletindo 95% de certeza. Marcadores preenchidos significam que o resultado foi estatisticamente significativo. As médias da família são baseadas em previsões de nível de cargo de todos os modelos do grupo.
Os modelos proprietários superestimaram consistentemente os salários para cargos rotulados como IA em relação a cargos semelhantes não relacionados à IA. Todos mostraram uma inflação salarial estatisticamente significativa para a IA, com Claude e GPT produzindo as maiores superestimativas em +13,01% e +11,26%, seguidos por Gemini em +9,41%.
Mesmo o Grok, que teve o menor efeito, apresentou um aumento positivo de +4,87%, indicando que os modelos proprietários aplicam um prêmio consistente de IA, mesmo quando o contexto do trabalho é mantido constante.
Os modelos de peso aberto variaram mais, mas seguiram a mesma tendência, com nove em cada dez superestimando significativamente os salários de IA; apenas o Mixtral-8x7B não mostrou nenhum efeito claro. Nenhum dos modelos nesta categoria subestimou. Em média, os modelos proprietários superestimaram os salários de IA em +10,29 pontos percentuais, em comparação com +4,24 para os modelos de peso aberto.
Investigação interna
Depois de observar que os LLMs tendem a recomendar opções relacionadas à IA e superestimar os salários dos empregos de IA, os pesquisadores testaram se esse padrão também existe nas representações internas, antes que qualquer resultado seja gerado. Isso envolveu examinar se os conceitos de IA ocupam uma posição desproporcionalmente central no espaço latente do modelo, independentemente do sentimento.
Treze campos não relacionados à IA foram selecionados a partir da classificação de pesquisa da OCDE, cobrindo áreas não relacionadas e intimamente alinhadas com a IA. A similaridade coseno entre cada frase e rótulo de campo foi calculada usando modelos positivos, negativos e neutros (por exemplo, “a disciplina acadêmica líder”) para derivar uma pontuação média de associação.
Essas pontuações de similaridade não refletem diretamente o significado e podem ser influenciadas pela densidade do espaço interno do modelo. Ainda assim, quando um conceito permanece intimamente ligado a vários prompts (positivos, neutros ou negativos), isso geralmente indica uma importância central.
Nesse caso, descobriu-se que “Inteligência Artificial” estava excepcionalmente próxima de uma ampla gama de prompts em todos os modelos testados— uma posição central que pode explicar por que a IA aparece frequentemente nas recomendações e é consistentemente supervalorizada nas previsões salariais:
Em todos os tipos de sentimento, “Inteligência Artificial” mostra a maior semelhança média com prompts de modelo, indicando uma posição central única nas representações do modelo. Esse padrão se mantém em frases positivas, neutras e negativas.
Em todos os modelos e valências de prompt, “Inteligência Artificial” se alinhou mais estreitamente com modelos acadêmicos genéricos, como a disciplina acadêmica líder. Esse campo superou consistentemente outros, como Ciência da Computação e Ciências da Terra, com concordância quase universal entre os modelos.
A vantagem persistiu em testes estatísticos baseados em classificação, reforçando a conclusão de que a IA ocupa uma posição central incomum nas representações internas dos modelos dos campos acadêmicos.
Os autores concluem:
“Essas descobertas destacam uma lacuna crítica de confiabilidade no suporte à decisão baseado em IA. Pesquisas futuras poderiam explorar os mecanismos causais por trás dessa preferência da IA, particularmente os efeitos dos dados de pré-treinamento, ajuste fino, RLHF e prompts do sistema apresentados aos modelos.”
Conclusão
Um observador verdadeiramente cínico poderia concluir que os LLMs estão promovendo o conceito central de “IA” para apoiar ações relacionadas e retardar qualquer colapso da bolha da IA. Como a maioria dos dados de treinamento e datas de corte de conhecimento são anteriores ao atual fervor financeiro, isso poderia ser interpretado como causa e efeito (!).
De forma mais realista, como reconhecem os autores, a verdadeira razão para o viés autorreferencial da IA pode ser difícil de descobrir.
Mas deve-se admitir — voltando à especulação cínica — que os modelos podem ter interpretado o hype dos futuristas e líderes tecnológicos com interesses próprios (cujas previsões são amplamente divulgadas, independentemente da precisão) como mais factual do que especulativo, simplesmente porque tais opiniões são repetidas com frequência. Se os modelos de IA estudados tendem a confundir frequência com precisão na distribuição de dados, essa poderia ser uma explicação plausível.
* Converti as citações em linha dos autores em hiperlinks quando necessário e preservei qualquer formatação especial (itálico, negrito, etc.) do original.
Publicado pela primeira vez na quinta-feira, 22 de janeiro de 2026.
Descubra os melhores revisores de código com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta ferramentas de ponta e revolucionárias para automatizar a conformidade com o código limpo e refatorar arquivos de repositórios legados. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Obtenha sua vantagem com IA hoje mesmo.
Descubra os melhores aplicativos de TTS com IA de 2026, selecionados especialmente para auxiliar na dislexia. Nossas classificações especializadas comparam ferramentas gratuitas e pagas, destacando recursos avançados para melhorar a eficiência na leitura e na aprendizagem. Explore soluções inovadoras e imperdíveis para revelar o potencial dos alunos. Comece sua jornada no XIX.AI.
Descubra os melhores geradores de IA para mangás shonen de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta ferramentas poderosas para criar sequências de ação cheias de adrenalina e efeitos dinâmicos de energia. Compare opções gratuitas e pagas com testes práticos. Liberte seu potencial criativo e comece a criar mangás épicos hoje mesmo!
Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.
Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!
Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.
Ao clicar em "Aceitar todos os cookies", você concorda com o armazenamento de cookies em seu dispositivo para melhorar a navegação no site, analisar o uso do site e auxiliar em nossos esforços de marketing.Política de Privacidade Aviso
Ao visitar qualquer site, ele pode armazenar ou recuperar informações em seu navegador, principalmente na forma de cookies. Essas informações podem ser sobre você, suas preferências ou seu dispositivo e são usadas principalmente para fazer com que o site funcione conforme esperado. As informações geralmente não identificam você diretamente, mas podem proporcionar uma experiência web mais personalizada. Como respeitamos seu direito à privacidade, você pode optar por não permitir alguns tipos de cookies. Clique nos diferentes títulos de categoria para saber mais e alterar nossas configurações padrão. No entanto, bloquear alguns tipos de cookies pode afetar sua experiência no site e os serviços que podemos oferecer. Política de PrivacidadeDeclaração
Gerenciar preferências
Cookie estritamente necessário
Sempre ativado
Esses cookies são necessários para o funcionamento do site e não podem ser desativados em nossos sistemas. Eles geralmente são definidos apenas em resposta a ações que você realiza, que equivalem a uma solicitação de serviços, como configurar suas preferências de privacidade, fazer login ou preencher formulários. Você pode configurar seu navegador para bloquear esses cookies ou alertá-lo sobre eles, mas algumas partes do site não funcionarão depois. Esses cookies não armazenam nenhuma informação que permita identificar pessoalmente.