opción
Hogar
Noticias
Datagemma aborda alucinaciones de IA con datos del mundo real

Datagemma aborda alucinaciones de IA con datos del mundo real

10 de abril de 2025
147

Datagemma aborda alucinaciones de IA con datos del mundo real

Los modelos de lenguaje grandes (LLMs) están en el corazón de los avances de la IA actual, capaces de analizar enormes conjuntos de datos de texto para producir resúmenes, generar ideas creativas e incluso escribir código. Sin embargo, a pesar de su destreza, estos modelos a veces entregan información que es simplemente errónea, un problema que llamamos "alucinación". Es un gran obstáculo en el mundo de la IA generativa.

Estamos emocionados de compartir investigaciones de vanguardia que abordan este problema de frente, buscando reducir las alucinaciones al anclar los LLMs en estadísticas del mundo real. Y estamos encantados de presentar DataGemma, los primeros modelos abiertos que conectan LLMs con una gran cantidad de datos del mundo real de Google's Data Commons.

Data Commons: Un Tesoro de Datos Confiables

Data Commons es como una biblioteca gigante y en constante crecimiento de datos públicos, con más de 240 mil millones de puntos de datos sobre todo, desde salud hasta economía. Obtiene esta información de fuentes confiables como la ONU, la OMS, los CDC y las Oficinas de Censos. Al combinar estos conjuntos de datos en una única y poderosa herramienta y modelos de IA, Data Commons ayuda a los responsables de políticas, investigadores y organizaciones a obtener las ideas precisas que necesitan.

Imagina una enorme base de datos donde puedes hacer preguntas en español sencillo, como qué países africanos han experimentado el mayor aumento en el acceso a la electricidad, o cómo se relaciona el ingreso con la diabetes en los condados de EE. UU. Eso es Data Commons.

Cómo Data Commons Ayuda a Combatir las Alucinaciones

A medida que más personas recurren a la IA generativa, estamos trabajando para hacer que estas experiencias sean más sólidas al integrar Data Commons en Gemma, nuestra familia de modelos abiertos ligeros y de alta calidad. Estos modelos DataGemma ahora están disponibles para que investigadores y desarrolladores los exploren.

DataGemma mejora las capacidades de Gemma al aprovechar el conocimiento de Data Commons, utilizando dos métodos interesantes para mejorar la precisión y el razonamiento de los LLMs:

  1. RIG (Generación Intercalada con Recuperación) potencia nuestro modelo Gemma 2 al verificar activamente los hechos contra Data Commons. Cuando le haces una pregunta a DataGemma, busca datos estadísticos de Data Commons para darte una respuesta sólida. Aunque RIG no es una idea nueva, la forma en que lo usamos en DataGemma es bastante especial.

    Consulta de ejemplo: "¿Ha aumentado el uso de renovables en el mundo?" aplicando la metodología RIG de DataGemma aprovecha Data Commons (DC) para datos autorizados.
  2. RAG (Generación Aumentada por Recuperación) permite a los modelos de lenguaje incorporar información adicional más allá de lo que han sido entrenados, haciendo sus respuestas más ricas y precisas. Con DataGemma, usamos la ventana de contexto largo de Gemini 1.5 Pro para recuperar datos relevantes de Data Commons antes de que el modelo comience a elaborar su respuesta, reduciendo las alucinaciones.

    Consulta de ejemplo: "¿Ha aumentado el uso de renovables en el mundo?" aplicando la metodología RAG de DataGemma muestra un mayor razonamiento e inclusión de notas al pie.

Resultados Prometedores y Qué Sigue

Nuestras primeras pruebas con RIG y RAG son prometedoras. Estamos viendo una mejor precisión en nuestros modelos cuando manejan números, lo que significa menos alucinaciones para quienes usan estos modelos para investigación, toma de decisiones o simplemente para satisfacer su curiosidad. Puedes consultar estos resultados en nuestro artículo de investigación.

Ilustración de una consulta y respuesta RAG. Las estadísticas de verdad fundamentales se referencian como tablas proporcionadas por Data Commons. *Respuesta parcial mostrada por brevedad. No nos detenemos aquí. Estamos totalmente comprometidos en refinar estos métodos, escalar nuestros esfuerzos y someterlos a más pruebas rigurosas. Eventualmente, implementaremos estas mejoras en los modelos Gemma y Gemini, comenzando con una fase de acceso limitado.

Al compartir nuestra investigación y hacer que esta nueva variante del modelo Gemma sea abierta, esperamos difundir el uso de estas técnicas basadas en Data Commons por todas partes. Hacer que los LLMs sean más confiables y fidedignos es crucial para convertirlos en herramientas esenciales para todos, ayudando a construir un futuro donde la IA proporcione información precisa, apoye decisiones informadas y profundice nuestra comprensión del mundo.

Los investigadores y desarrolladores pueden comenzar de inmediato con DataGemma utilizando nuestros cuadernos de inicio rápido para RIG y RAG. Para profundizar en cómo funcionan juntos Data Commons y Gemma, consulta nuestro post de Investigación.

Artículo relacionado
Salesforce Presenta Compañeros Digitales de IA en Slack para Competir con Microsoft Copilot Salesforce Presenta Compañeros Digitales de IA en Slack para Competir con Microsoft Copilot Salesforce lanzó una nueva estrategia de IA para el lugar de trabajo, presentando “compañeros digitales” especializados integrados en las conversaciones de Slack, según reveló la compañía el lunes.La
Inversión de Oracle de $40 mil millones en chips Nvidia impulsa el centro de datos de IA en Texas Inversión de Oracle de $40 mil millones en chips Nvidia impulsa el centro de datos de IA en Texas Oracle planea invertir aproximadamente $40 mil millones en chips Nvidia para alimentar un importante centro de datos nuevo en Texas, desarrollado por OpenAI, según informó el Financial Times. Este acu
Aplicación de Meta AI para Introducir un Nivel Premium y Anuncios Aplicación de Meta AI para Introducir un Nivel Premium y Anuncios La aplicación de IA de Meta pronto podría incluir una suscripción de pago, siguiendo el modelo de competidores como OpenAI, Google y Microsoft. Durante una llamada de resultados del primer trimestre d
comentario (37)
0/200
StephenScott
StephenScott 8 de agosto de 2025 11:00:59 GMT+02:00

This article on DataGemma is super intriguing! I love how it dives into fixing AI hallucinations with real-world data. Makes me wonder if we’ll finally get models that don’t spit out random nonsense. 😄 Anyone else excited about this?

ArthurYoung
ArthurYoung 29 de julio de 2025 14:25:16 GMT+02:00

This article on DataGemma is super intriguing! It's wild how LLMs can churn out so much but still trip over facts. Excited to see how real-world data could make AI less of a fibber! 😄

RalphJohnson
RalphJohnson 21 de abril de 2025 06:26:32 GMT+02:00

DataGemmaは本当に助かる!AIの幻覚を現実世界のデータで抑えてくれるから、まるでAIにファクトチェッカーが付いているみたい。もう少し処理が早ければ完璧なんだけど、それでも素晴らしいツールだよね!👍

WillieAnderson
WillieAnderson 17 de abril de 2025 23:10:42 GMT+02:00

DataGemma 정말 도움이 돼! AI의 환각을 현실 세계 데이터로 줄여주니까, 마치 AI에 팩트체커가 있는 것 같아. 처리 속도가 조금 더 빨랐으면 좋겠지만, 그래도 훌륭한 도구야! 👍

JosephGreen
JosephGreen 16 de abril de 2025 22:14:53 GMT+02:00

DataGemma is a lifesaver! It really cuts down on those annoying AI hallucinations by grounding the models in real-world data. It's like having a fact-checker for my AI buddy. Only wish it was a bit faster at processing, but still, it's a solid tool! 👍

LeviKing
LeviKing 13 de abril de 2025 22:47:31 GMT+02:00

DataGemma가 AI의 환각을 해결하기 위한 접근 방식은 정말 멋집니다. 실제 세계의 데이터를 사용하여 AI를 제어하는 것은 훌륭해요. 하지만 정말 문제를 해결하는 건지, 아니면 그저 가리는 건지 궁금해요. 그래도 올바른 방향으로 나아가는 한 걸음이죠. 계속 하세요!

Volver arriba
OR