Datagemma aborda alucinaciones de IA con datos del mundo real

Los modelos de lenguaje grandes (LLMs) están en el corazón de los avances de la IA actual, capaces de analizar enormes conjuntos de datos de texto para producir resúmenes, generar ideas creativas e incluso escribir código. Sin embargo, a pesar de su destreza, estos modelos a veces entregan información que es simplemente errónea, un problema que llamamos "alucinación". Es un gran obstáculo en el mundo de la IA generativa.
Estamos emocionados de compartir investigaciones de vanguardia que abordan este problema de frente, buscando reducir las alucinaciones al anclar los LLMs en estadísticas del mundo real. Y estamos encantados de presentar DataGemma, los primeros modelos abiertos que conectan LLMs con una gran cantidad de datos del mundo real de Google's Data Commons.
Data Commons: Un Tesoro de Datos Confiables
Data Commons es como una biblioteca gigante y en constante crecimiento de datos públicos, con más de 240 mil millones de puntos de datos sobre todo, desde salud hasta economía. Obtiene esta información de fuentes confiables como la ONU, la OMS, los CDC y las Oficinas de Censos. Al combinar estos conjuntos de datos en una única y poderosa herramienta y modelos de IA, Data Commons ayuda a los responsables de políticas, investigadores y organizaciones a obtener las ideas precisas que necesitan.
Imagina una enorme base de datos donde puedes hacer preguntas en español sencillo, como qué países africanos han experimentado el mayor aumento en el acceso a la electricidad, o cómo se relaciona el ingreso con la diabetes en los condados de EE. UU. Eso es Data Commons.
Cómo Data Commons Ayuda a Combatir las Alucinaciones
A medida que más personas recurren a la IA generativa, estamos trabajando para hacer que estas experiencias sean más sólidas al integrar Data Commons en Gemma, nuestra familia de modelos abiertos ligeros y de alta calidad. Estos modelos DataGemma ahora están disponibles para que investigadores y desarrolladores los exploren.
DataGemma mejora las capacidades de Gemma al aprovechar el conocimiento de Data Commons, utilizando dos métodos interesantes para mejorar la precisión y el razonamiento de los LLMs:
RIG (Generación Intercalada con Recuperación) potencia nuestro modelo Gemma 2 al verificar activamente los hechos contra Data Commons. Cuando le haces una pregunta a DataGemma, busca datos estadísticos de Data Commons para darte una respuesta sólida. Aunque RIG no es una idea nueva, la forma en que lo usamos en DataGemma es bastante especial.
Consulta de ejemplo: "¿Ha aumentado el uso de renovables en el mundo?" aplicando la metodología RIG de DataGemma aprovecha Data Commons (DC) para datos autorizados.
RAG (Generación Aumentada por Recuperación) permite a los modelos de lenguaje incorporar información adicional más allá de lo que han sido entrenados, haciendo sus respuestas más ricas y precisas. Con DataGemma, usamos la ventana de contexto largo de Gemini 1.5 Pro para recuperar datos relevantes de Data Commons antes de que el modelo comience a elaborar su respuesta, reduciendo las alucinaciones.
Consulta de ejemplo: "¿Ha aumentado el uso de renovables en el mundo?" aplicando la metodología RAG de DataGemma muestra un mayor razonamiento e inclusión de notas al pie.
Resultados Prometedores y Qué Sigue
Nuestras primeras pruebas con RIG y RAG son prometedoras. Estamos viendo una mejor precisión en nuestros modelos cuando manejan números, lo que significa menos alucinaciones para quienes usan estos modelos para investigación, toma de decisiones o simplemente para satisfacer su curiosidad. Puedes consultar estos resultados en nuestro artículo de investigación.
Ilustración de una consulta y respuesta RAG. Las estadísticas de verdad fundamentales se referencian como tablas proporcionadas por Data Commons. *Respuesta parcial mostrada por brevedad.
No nos detenemos aquí. Estamos totalmente comprometidos en refinar estos métodos, escalar nuestros esfuerzos y someterlos a más pruebas rigurosas. Eventualmente, implementaremos estas mejoras en los modelos Gemma y Gemini, comenzando con una fase de acceso limitado.
Al compartir nuestra investigación y hacer que esta nueva variante del modelo Gemma sea abierta, esperamos difundir el uso de estas técnicas basadas en Data Commons por todas partes. Hacer que los LLMs sean más confiables y fidedignos es crucial para convertirlos en herramientas esenciales para todos, ayudando a construir un futuro donde la IA proporcione información precisa, apoye decisiones informadas y profundice nuestra comprensión del mundo.
Los investigadores y desarrolladores pueden comenzar de inmediato con DataGemma utilizando nuestros cuadernos de inicio rápido para RIG y RAG. Para profundizar en cómo funcionan juntos Data Commons y Gemma, consulta nuestro post de Investigación.
Artículo relacionado
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física
Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
Recomendaciones de temas especiales relacionados
comentario (42)
0/500
Interesting approach! Using real-world data to ground the model seems like a practical step beyond just scaling parameters. Hope it doesn't just trade hallucinations for boring, overly-cautious outputs though. The 'Gemma' naming trend continues! 🤔
Finally! A real solution to AI hallucinations? DataGemma sounds promising, but I'm honestly a bit skeptical. 🤔 How do they ensure the "real-world data" isn't biased itself? Would love to see a breakdown of their methodology compared to other approaches like Retrieval-Augmented Generation.
Me pregunto si DataGemma realmente podrá resolver el problema de las alucinaciones en IA. Parece prometedor, pero ya hemos visto muchas soluciones 'milagrosas' que luego no cumplen. Ojalá esta vez sea diferente, porque los errores en los modelos actuales pueden ser bastante graves 😅
This article on DataGemma is super intriguing! It's wild how LLMs can churn out so much but still trip up on facts sometimes. 😅 Makes me wonder if grounding them in real-world data could finally make AI as reliable as we hope!

Los modelos de lenguaje grandes (LLMs) están en el corazón de los avances de la IA actual, capaces de analizar enormes conjuntos de datos de texto para producir resúmenes, generar ideas creativas e incluso escribir código. Sin embargo, a pesar de su destreza, estos modelos a veces entregan información que es simplemente errónea, un problema que llamamos "alucinación". Es un gran obstáculo en el mundo de la IA generativa.
Estamos emocionados de compartir investigaciones de vanguardia que abordan este problema de frente, buscando reducir las alucinaciones al anclar los LLMs en estadísticas del mundo real. Y estamos encantados de presentar DataGemma, los primeros modelos abiertos que conectan LLMs con una gran cantidad de datos del mundo real de Google's Data Commons.
Data Commons: Un Tesoro de Datos Confiables
Data Commons es como una biblioteca gigante y en constante crecimiento de datos públicos, con más de 240 mil millones de puntos de datos sobre todo, desde salud hasta economía. Obtiene esta información de fuentes confiables como la ONU, la OMS, los CDC y las Oficinas de Censos. Al combinar estos conjuntos de datos en una única y poderosa herramienta y modelos de IA, Data Commons ayuda a los responsables de políticas, investigadores y organizaciones a obtener las ideas precisas que necesitan.
Imagina una enorme base de datos donde puedes hacer preguntas en español sencillo, como qué países africanos han experimentado el mayor aumento en el acceso a la electricidad, o cómo se relaciona el ingreso con la diabetes en los condados de EE. UU. Eso es Data Commons.
Cómo Data Commons Ayuda a Combatir las Alucinaciones
A medida que más personas recurren a la IA generativa, estamos trabajando para hacer que estas experiencias sean más sólidas al integrar Data Commons en Gemma, nuestra familia de modelos abiertos ligeros y de alta calidad. Estos modelos DataGemma ahora están disponibles para que investigadores y desarrolladores los exploren.
DataGemma mejora las capacidades de Gemma al aprovechar el conocimiento de Data Commons, utilizando dos métodos interesantes para mejorar la precisión y el razonamiento de los LLMs:
RIG (Generación Intercalada con Recuperación) potencia nuestro modelo Gemma 2 al verificar activamente los hechos contra Data Commons. Cuando le haces una pregunta a DataGemma, busca datos estadísticos de Data Commons para darte una respuesta sólida. Aunque RIG no es una idea nueva, la forma en que lo usamos en DataGemma es bastante especial.
Consulta de ejemplo: "¿Ha aumentado el uso de renovables en el mundo?" aplicando la metodología RIG de DataGemma aprovecha Data Commons (DC) para datos autorizados. RAG (Generación Aumentada por Recuperación) permite a los modelos de lenguaje incorporar información adicional más allá de lo que han sido entrenados, haciendo sus respuestas más ricas y precisas. Con DataGemma, usamos la ventana de contexto largo de Gemini 1.5 Pro para recuperar datos relevantes de Data Commons antes de que el modelo comience a elaborar su respuesta, reduciendo las alucinaciones.
Consulta de ejemplo: "¿Ha aumentado el uso de renovables en el mundo?" aplicando la metodología RAG de DataGemma muestra un mayor razonamiento e inclusión de notas al pie.
Resultados Prometedores y Qué Sigue
Nuestras primeras pruebas con RIG y RAG son prometedoras. Estamos viendo una mejor precisión en nuestros modelos cuando manejan números, lo que significa menos alucinaciones para quienes usan estos modelos para investigación, toma de decisiones o simplemente para satisfacer su curiosidad. Puedes consultar estos resultados en nuestro artículo de investigación.
Al compartir nuestra investigación y hacer que esta nueva variante del modelo Gemma sea abierta, esperamos difundir el uso de estas técnicas basadas en Data Commons por todas partes. Hacer que los LLMs sean más confiables y fidedignos es crucial para convertirlos en herramientas esenciales para todos, ayudando a construir un futuro donde la IA proporcione información precisa, apoye decisiones informadas y profundice nuestra comprensión del mundo.
Los investigadores y desarrolladores pueden comenzar de inmediato con DataGemma utilizando nuestros cuadernos de inicio rápido para RIG y RAG. Para profundizar en cómo funcionan juntos Data Commons y Gemma, consulta nuestro post de Investigación.
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
Interesting approach! Using real-world data to ground the model seems like a practical step beyond just scaling parameters. Hope it doesn't just trade hallucinations for boring, overly-cautious outputs though. The 'Gemma' naming trend continues! 🤔
Finally! A real solution to AI hallucinations? DataGemma sounds promising, but I'm honestly a bit skeptical. 🤔 How do they ensure the "real-world data" isn't biased itself? Would love to see a breakdown of their methodology compared to other approaches like Retrieval-Augmented Generation.
Me pregunto si DataGemma realmente podrá resolver el problema de las alucinaciones en IA. Parece prometedor, pero ya hemos visto muchas soluciones 'milagrosas' que luego no cumplen. Ojalá esta vez sea diferente, porque los errores en los modelos actuales pueden ser bastante graves 😅
This article on DataGemma is super intriguing! It's wild how LLMs can churn out so much but still trip up on facts sometimes. 😅 Makes me wonder if grounding them in real-world data could finally make AI as reliable as we hope!





Hogar






