opção
Lar
Notícias
DataGemma aborda as alucinações AI com dados do mundo real

DataGemma aborda as alucinações AI com dados do mundo real

10 de Abril de 2025
237

DataGemma aborda as alucinações AI com dados do mundo real

Modelos de linguagem de grande escala (LLMs) estão no centro dos avanços em IA hoje, capazes de analisar enormes conjuntos de dados de texto para produzir resumos, gerar ideias criativas e até escrever código. No entanto, apesar de sua capacidade, esses modelos podem às vezes fornecer informações simplesmente erradas, um problema que chamamos de "alucinação". É um grande obstáculo no mundo da IA generativa.

Estamos empolgados em compartilhar pesquisas de ponta que abordam essa questão diretamente, visando reduzir alucinações ao ancorar LLMs em estatísticas do mundo real. E estamos entusiasmados em apresentar DataGemma, os primeiros modelos abertos que conectam LLMs a uma riqueza de dados do mundo real do Data Commons do Google.

Data Commons: Um Tesouro de Dados Confiáveis

Data Commons é como uma biblioteca gigante e em constante crescimento de dados públicos, com mais de 240 bilhões de pontos de dados sobre tudo, desde saúde até economia. Ele obtém essas informações de fontes confiáveis como ONU, OMS, CDC e Bureaus de Censo. Ao unir esses conjuntos de dados em uma única ferramenta poderosa e modelos de IA, Data Commons ajuda formuladores de políticas, pesquisadores e organizações a obterem as informações precisas de que precisam.

Imagine um vasto banco de dados onde você pode fazer perguntas em português simples, como quais países africanos tiveram o maior aumento no acesso à eletricidade, ou como a renda se relaciona com diabetes nos condados dos EUA. Isso é o Data Commons para você.

Como o Data Commons Ajuda a Combater Alucinações

À medida que mais pessoas recorrem à IA generativa, estamos trabalhando para tornar essas experiências mais fundamentadas ao integrar Data Commons na Gemma, nossa família de modelos abertos leves e de alta qualidade. Esses modelos DataGemma agora estão disponíveis para pesquisadores e desenvolvedores explorarem.

DataGemma aprimora as capacidades da Gemma ao acessar o conhecimento do Data Commons, usando dois métodos interessantes para melhorar a precisão e o raciocínio dos LLMs:

  1. RIG (Geração Intercalada por Recuperação) melhora nosso modelo Gemma 2 ao verificar ativamente os fatos contra o Data Commons. Quando você faz uma pergunta ao DataGemma, ele busca dados estatísticos do Data Commons para fornecer uma resposta sólida. Embora o RIG não seja uma ideia nova, a forma como o usamos no DataGemma é bastante especial.

    Exemplo de consulta: ''O uso de renováveis aumentou no mundo?'' aplicando a metodologia RIG do DataGemma utiliza o Data Commons (DC) para dados autoritativos.
  2. RAG (Geração Aumentada por Recuperação) permite que modelos de linguagem tragam informações adicionais além do que foram treinados, tornando suas respostas mais ricas e precisas. Com DataGemma, usamos a janela de contexto longa do Gemini 1.5 Pro para buscar dados relevantes do Data Commons antes que o modelo comece a elaborar sua resposta, reduzindo alucinações.

    Exemplo de consulta: ''O uso de renováveis aumentou no mundo?'' aplicando a metodologia RAG do DataGemma demonstra maior raciocínio e inclusão de notas de rodapé.

Resultados Promissores e Próximos Passos

Nossos testes iniciais com RIG e RAG estão promissores. Estamos vendo maior precisão em nossos modelos ao lidar com números, o que significa menos alucinações para pessoas usando esses modelos para pesquisa, tomada de decisão ou apenas para satisfazer sua curiosidade. Você pode conferir esses resultados em nosso artigo de pesquisa.

Ilustração de uma consulta RAG e resposta. Estatísticas de suporte à verdade fundamental são referenciadas como tabelas servidas pelo Data Commons. *Resposta parcial mostrada por brevidade. Não vamos parar por aqui. Estamos totalmente focados em refinar esses métodos, escalar nossos esforços e testá-los rigorosamente. Eventualmente, implementaremos essas melhorias nos modelos Gemma e Gemini, começando com uma fase de acesso limitado.

Ao compartilhar nossa pesquisa e tornar esta nova variante do modelo Gemma aberta, esperamos espalhar o uso dessas técnicas baseadas no Data Commons amplamente. Tornar os LLMs mais confiáveis e fidedignos é crucial para transformá-los em ferramentas essenciais para todos, ajudando a construir um futuro onde a IA fornece informações precisas, apoia escolhas informadas e aprofunda nossa compreensão do mundo.

Pesquisadores e desenvolvedores podem começar imediatamente com o DataGemma usando nossos notebooks de início rápido para RIG e RAG. Para explorar mais a fundo como Data Commons e Gemma trabalham juntos, confira nosso post de pesquisa.

Artigo relacionado
O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou
A Kakao Mobility apresenta o plano de ação para a direção autônoma de nível 4 com IA física A Kakao Mobility apresenta o plano de ação para a direção autônoma de nível 4 com IA física A Kakao Mobility planeja desenvolver tecnologias de direção autônoma de nível 4 internamente, como parte de sua estratégia de IA física.Na conferência World IT Show 2026, realizada no COEX, em Seul,
Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future
Recomendações de tópicos especiais relacionados
Negócios As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos
As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas
xix.ai
Produtividade Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental
Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas
xix.ai
chatbot Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes
Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas
xix.ai
Educação e Aprendizagem Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina
Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas
xix.ai
chatbot Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real
Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real

Descubra os melhores treinadores de conversação e paquera com IA de 2026 no XIX.AI. Nossa seleção cuidadosamente escolhida e com as melhores avaliações ajuda você a desenvolver carisma social e confiança em tempo real. Explore ferramentas imperdíveis e revolucionárias, com comparações entre versões gratuitas e pagas e rankings atualizados semanalmente. Descubra hoje mesmo o seu diferencial social.

10 ferramentas
xix.ai
código Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique
Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique

Descubra as mais recentes e bem avaliadas ferramentas de IA de 2026 para testes unitários automatizados. Nossa seleção cuidadosa inclui soluções poderosas que podem transformar o seu processo, permitindo gerar casos de teste para Jest, PyTest e JUnit de forma instantânea. Compare opções gratuitas e pagas com testes reais e classificações atualizadas semanalmente no XIX.AI. Desfrute das vantagens da IA e aumente a produtividade do seu desenvolvimento hoje mesmo.

10 ferramentas
xix.ai
Comentários (42)
0/500
PaulLopez
PaulLopez 9 de Maio de 2026 à13 13:00:13 WEST

DataGemma這方法聽起來挺實際的,直接用真實數據來對抗AI幻覺,感覺比單純調整演算法更治本。不過好奇它處理的數據範圍有多大?會不會有偏見問題?希望未來能看到更多實測結果!🤔

HarryRoberts
HarryRoberts 12 de Abril de 2026 à14 07:01:14 WEST

Interesting approach! Using real-world data to ground the model seems like a practical step beyond just scaling parameters. Hope it doesn't just trade hallucinations for boring, overly-cautious outputs though. The 'Gemma' naming trend continues! 🤔

WilliamRamirez
WilliamRamirez 18 de Outubro de 2025 à33 11:30:33 WEST

Finally! A real solution to AI hallucinations? DataGemma sounds promising, but I'm honestly a bit skeptical. 🤔 How do they ensure the "real-world data" isn't biased itself? Would love to see a breakdown of their methodology compared to other approaches like Retrieval-Augmented Generation.

WillMitchell
WillMitchell 4 de Outubro de 2025 à40 19:30:40 WEST

Me pregunto si DataGemma realmente podrá resolver el problema de las alucinaciones en IA. Parece prometedor, pero ya hemos visto muchas soluciones 'milagrosas' que luego no cumplen. Ojalá esta vez sea diferente, porque los errores en los modelos actuales pueden ser bastante graves 😅

BillyAdams
BillyAdams 25 de Agosto de 2025 à2 10:47:02 WEST

This article on DataGemma is super intriguing! It's wild how LLMs can churn out so much but still trip up on facts sometimes. 😅 Makes me wonder if grounding them in real-world data could finally make AI as reliable as we hope!

StephenScott
StephenScott 8 de Agosto de 2025 à59 10:00:59 WEST

This article on DataGemma is super intriguing! I love how it dives into fixing AI hallucinations with real-world data. Makes me wonder if we’ll finally get models that don’t spit out random nonsense. 😄 Anyone else excited about this?

OR