opción
Hogar
Noticias
Datagemma aborda alucinaciones de IA con datos del mundo real

Datagemma aborda alucinaciones de IA con datos del mundo real

10 de abril de 2025
237

Datagemma aborda alucinaciones de IA con datos del mundo real

Los modelos de lenguaje grandes (LLMs) están en el corazón de los avances de la IA actual, capaces de analizar enormes conjuntos de datos de texto para producir resúmenes, generar ideas creativas e incluso escribir código. Sin embargo, a pesar de su destreza, estos modelos a veces entregan información que es simplemente errónea, un problema que llamamos "alucinación". Es un gran obstáculo en el mundo de la IA generativa.

Estamos emocionados de compartir investigaciones de vanguardia que abordan este problema de frente, buscando reducir las alucinaciones al anclar los LLMs en estadísticas del mundo real. Y estamos encantados de presentar DataGemma, los primeros modelos abiertos que conectan LLMs con una gran cantidad de datos del mundo real de Google's Data Commons.

Data Commons: Un Tesoro de Datos Confiables

Data Commons es como una biblioteca gigante y en constante crecimiento de datos públicos, con más de 240 mil millones de puntos de datos sobre todo, desde salud hasta economía. Obtiene esta información de fuentes confiables como la ONU, la OMS, los CDC y las Oficinas de Censos. Al combinar estos conjuntos de datos en una única y poderosa herramienta y modelos de IA, Data Commons ayuda a los responsables de políticas, investigadores y organizaciones a obtener las ideas precisas que necesitan.

Imagina una enorme base de datos donde puedes hacer preguntas en español sencillo, como qué países africanos han experimentado el mayor aumento en el acceso a la electricidad, o cómo se relaciona el ingreso con la diabetes en los condados de EE. UU. Eso es Data Commons.

Cómo Data Commons Ayuda a Combatir las Alucinaciones

A medida que más personas recurren a la IA generativa, estamos trabajando para hacer que estas experiencias sean más sólidas al integrar Data Commons en Gemma, nuestra familia de modelos abiertos ligeros y de alta calidad. Estos modelos DataGemma ahora están disponibles para que investigadores y desarrolladores los exploren.

DataGemma mejora las capacidades de Gemma al aprovechar el conocimiento de Data Commons, utilizando dos métodos interesantes para mejorar la precisión y el razonamiento de los LLMs:

  1. RIG (Generación Intercalada con Recuperación) potencia nuestro modelo Gemma 2 al verificar activamente los hechos contra Data Commons. Cuando le haces una pregunta a DataGemma, busca datos estadísticos de Data Commons para darte una respuesta sólida. Aunque RIG no es una idea nueva, la forma en que lo usamos en DataGemma es bastante especial.

    Consulta de ejemplo: "¿Ha aumentado el uso de renovables en el mundo?" aplicando la metodología RIG de DataGemma aprovecha Data Commons (DC) para datos autorizados.
  2. RAG (Generación Aumentada por Recuperación) permite a los modelos de lenguaje incorporar información adicional más allá de lo que han sido entrenados, haciendo sus respuestas más ricas y precisas. Con DataGemma, usamos la ventana de contexto largo de Gemini 1.5 Pro para recuperar datos relevantes de Data Commons antes de que el modelo comience a elaborar su respuesta, reduciendo las alucinaciones.

    Consulta de ejemplo: "¿Ha aumentado el uso de renovables en el mundo?" aplicando la metodología RAG de DataGemma muestra un mayor razonamiento e inclusión de notas al pie.

Resultados Prometedores y Qué Sigue

Nuestras primeras pruebas con RIG y RAG son prometedoras. Estamos viendo una mejor precisión en nuestros modelos cuando manejan números, lo que significa menos alucinaciones para quienes usan estos modelos para investigación, toma de decisiones o simplemente para satisfacer su curiosidad. Puedes consultar estos resultados en nuestro artículo de investigación.

Ilustración de una consulta y respuesta RAG. Las estadísticas de verdad fundamentales se referencian como tablas proporcionadas por Data Commons. *Respuesta parcial mostrada por brevedad. No nos detenemos aquí. Estamos totalmente comprometidos en refinar estos métodos, escalar nuestros esfuerzos y someterlos a más pruebas rigurosas. Eventualmente, implementaremos estas mejoras en los modelos Gemma y Gemini, comenzando con una fase de acceso limitado.

Al compartir nuestra investigación y hacer que esta nueva variante del modelo Gemma sea abierta, esperamos difundir el uso de estas técnicas basadas en Data Commons por todas partes. Hacer que los LLMs sean más confiables y fidedignos es crucial para convertirlos en herramientas esenciales para todos, ayudando a construir un futuro donde la IA proporcione información precisa, apoye decisiones informadas y profundice nuestra comprensión del mundo.

Los investigadores y desarrolladores pueden comenzar de inmediato con DataGemma utilizando nuestros cuadernos de inicio rápido para RIG y RAG. Para profundizar en cómo funcionan juntos Data Commons y Gemma, consulta nuestro post de Investigación.

Artículo relacionado
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
Recomendaciones de temas especiales relacionados
Negocio Los mejores gestores de gastos con IA: escanea recibos y clasifica automáticamente los gastos de la empresa
Los mejores gestores de gastos con IA: escanea recibos y clasifica automáticamente los gastos de la empresa

Los mejores gestores de gastos con IA de 2026: las herramientas mejor valoradas para escanear recibos y clasificar automáticamente los gastos de la empresa. Descubre soluciones potentes y revolucionarias para una gestión de gastos sin esfuerzo, un seguimiento financiero preciso y un cumplimiento normativo optimizado. Nuestra comparativa, seleccionada y actualizada semanalmente, entre opciones gratuitas y de pago te ayuda a encontrar la que mejor se adapta a tus necesidades. Aprovecha al máximo las ventajas de la IA con las recomendaciones de los expertos de XIX.AI.

10 herramientas
xix.ai
Negocio Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos
Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos

Descubre las mejores herramientas de selección de personal basadas en IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada, incluye soluciones potentes y revolucionarias para la selección de currículos y la automatización de la programación de entrevistas con los candidatos. Compara las opciones gratuitas con las de pago gracias a pruebas reales y a clasificaciones que se actualizan semanalmente. ¡Encuentra tu asistente de selección de personal ideal y optimiza tu proceso de selección hoy mismo!

10 herramientas
xix.ai
Productividad Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental
Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental

Descubre los mejores entrenadores personales de bienestar y concentración basados en IA de 2026 en XIX.AI. Nuestras clasificaciones, cuidadosamente seleccionadas, incluyen herramientas revolucionarias y de primera categoría para gestionar el agotamiento y potenciar la energía mental. Compara las opciones gratuitas con las de pago gracias a información basada en casos reales. Descubre hoy mismo el camino hacia la máxima productividad y el bienestar.

10 herramientas
xix.ai
chatbot Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes
Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes

Descubre los mejores chatbots románticos con IA de 2026 para establecer relaciones auténticas y duraderas. Nuestra lista seleccionada incluye personalidades sólidas y coherentes, comparativas entre versiones gratuitas y de pago, y pruebas en situaciones reales. Encuentra a tu compañero ideal y empieza a construir tu relación hoy mismo en XIX.AI.

10 herramientas
xix.ai
Educación y aprendizaje Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.
Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.

Descubra a los mejores mentores en ciencia de datos y AI de 2026 para dominar SQL, Pandas y flujos de trabajo de aprendizaje automático. Explore nuestra selección cuidadosamente seleccionada y altamente valorada en XIX.AI para obtener orientación poderosa que cambie completamente la situación. Compare las opciones gratuitas con las pagadas y obtenga información basada en casos reales. Desbloquee su dominio de la ciencia de datos hoy mismo.

10 herramientas
xix.ai
chatbot Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real
Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real

Descubre los mejores cursos de 2026 sobre coqueteo y conversación con IA en XIX.AI. Nuestra selección, cuidadosamente seleccionada y con las mejores valoraciones, te ayuda a desarrollar tu carisma social y tu confianza en tiempo real. Explora herramientas imprescindibles y revolucionarias con comparativas entre versiones gratuitas y de pago, y clasificaciones que se actualizan semanalmente. Potencia hoy mismo tus habilidades sociales.

10 herramientas
xix.ai
comentario (42)
0/500
PaulLopez
PaulLopez 9 de mayo de 2026 14:00:13 GMT+02:00

DataGemma這方法聽起來挺實際的,直接用真實數據來對抗AI幻覺,感覺比單純調整演算法更治本。不過好奇它處理的數據範圍有多大?會不會有偏見問題?希望未來能看到更多實測結果!🤔

HarryRoberts
HarryRoberts 12 de abril de 2026 08:01:14 GMT+02:00

Interesting approach! Using real-world data to ground the model seems like a practical step beyond just scaling parameters. Hope it doesn't just trade hallucinations for boring, overly-cautious outputs though. The 'Gemma' naming trend continues! 🤔

WilliamRamirez
WilliamRamirez 18 de octubre de 2025 12:30:33 GMT+02:00

Finally! A real solution to AI hallucinations? DataGemma sounds promising, but I'm honestly a bit skeptical. 🤔 How do they ensure the "real-world data" isn't biased itself? Would love to see a breakdown of their methodology compared to other approaches like Retrieval-Augmented Generation.

WillMitchell
WillMitchell 4 de octubre de 2025 20:30:40 GMT+02:00

Me pregunto si DataGemma realmente podrá resolver el problema de las alucinaciones en IA. Parece prometedor, pero ya hemos visto muchas soluciones 'milagrosas' que luego no cumplen. Ojalá esta vez sea diferente, porque los errores en los modelos actuales pueden ser bastante graves 😅

BillyAdams
BillyAdams 25 de agosto de 2025 11:47:02 GMT+02:00

This article on DataGemma is super intriguing! It's wild how LLMs can churn out so much but still trip up on facts sometimes. 😅 Makes me wonder if grounding them in real-world data could finally make AI as reliable as we hope!

StephenScott
StephenScott 8 de agosto de 2025 11:00:59 GMT+02:00

This article on DataGemma is super intriguing! I love how it dives into fixing AI hallucinations with real-world data. Makes me wonder if we’ll finally get models that don’t spit out random nonsense. 😄 Anyone else excited about this?

OR