opción
Hogar
Noticias
¿Qué hay dentro del LLM? Ai2 Olmotrace 'rastreará' la fuente

¿Qué hay dentro del LLM? Ai2 Olmotrace 'rastreará' la fuente

21 de abril de 2025
256

¿Qué hay dentro del LLM? Ai2 Olmotrace 'rastreará' la fuente

Comprender la conexión entre la salida de un modelo de lenguaje grande (LLM) y sus datos de entrenamiento siempre ha sido un poco un rompecabezas para la TI empresarial. Esta semana, el Allen Institute for AI (Ai2) lanzó una emocionante nueva iniciativa de código abierto llamada OLMoTrace, que busca desmitificar esta relación. Al permitir a los usuarios rastrear las salidas de los LLM hasta sus datos de entrenamiento originales, OLMoTrace aborda uno de los mayores obstáculos para la adopción de la IA empresarial: la falta de transparencia en los procesos de toma de decisiones de la IA.

OLMo, que significa Modelo de Lenguaje Abierto, es el nombre de la familia de LLMs de código abierto de Ai2. Puedes probar OLMoTrace con el último modelo OLMo 2 32B en el sitio Playground de Ai2. Además, el código de fuente abierta está disponible en GitHub, por lo que cualquiera puede usarlo libremente.

Lo que distingue a OLMoTrace de otros métodos, como aquellos que se centran en puntajes de confianza o generación aumentada por recuperación, es que proporciona una visión clara de cómo las salidas del modelo se relacionan con los vastos conjuntos de datos de entrenamiento que los formaron. Jiacheng Liu, un investigador de Ai2, dijo a VentureBeat: "Nuestro objetivo es ayudar a los usuarios a entender por qué los modelos de lenguaje generan las respuestas que generan."

Cómo funciona OLMoTrace: Más que solo citas

Mientras que LLMs como Perplexity o ChatGPT Search pueden ofrecer citas de fuentes, operan de manera diferente a OLMoTrace. Según Liu, estos modelos utilizan generación aumentada por recuperación (RAG), que busca mejorar la calidad de la salida del modelo incorporando fuentes adicionales más allá de los datos de entrenamiento. Por otro lado, OLMoTrace rastrea la salida del modelo directamente hasta el corpus de entrenamiento sin depender de RAG o documentos externos.

La herramienta identifica secuencias de texto únicas en las salidas del modelo y las empareja con documentos específicos de los datos de entrenamiento. Cuando se encuentra una coincidencia, OLMoTrace no solo resalta el texto relevante, sino que también proporciona enlaces al material de la fuente original. Esto permite a los usuarios ver exactamente dónde y cómo el modelo aprendió la información que utiliza.

Más allá de los puntajes de confianza: Evidencia tangible de la toma de decisiones de la IA

Los LLMs normalmente generan salidas basadas en los pesos del modelo, que se utilizan para calcular un puntaje de confianza. Cuanto mayor es el puntaje, supuestamente más precisa es la salida. Sin embargo, Liu cree que estos puntajes pueden ser engañosos. "Los modelos pueden estar demasiado confiados en lo que generan, y si les pides que generen un puntaje, suele estar inflado," explicó. "Eso es lo que los académicos llaman un error de calibración: la confianza que los modelos muestran no siempre refleja cuán precisas son realmente sus respuestas."

En lugar de depender de puntajes potencialmente engañosos, OLMoTrace ofrece evidencia directa de las fuentes de aprendizaje del modelo, permitiendo a los usuarios hacer juicios informados. "Lo que hace OLMoTrace es mostrar las coincidencias entre las salidas del modelo y los documentos de entrenamiento," dijo Liu. "A través de la interfaz, puedes ver directamente dónde están los puntos de coincidencia y cómo las salidas del modelo coinciden con los documentos de entrenamiento."

Cómo se compara OLMoTrace con otros enfoques de transparencia

Ai2 no es la única organización trabajando para comprender mejor las salidas de los LLM. Anthropic también ha realizado investigaciones, pero su enfoque ha estado en las operaciones internas del modelo más que en sus datos. Liu destacó la diferencia: "Estamos tomando un enfoque diferente al de ellos. Estamos rastreando directamente el comportamiento del modelo, sus datos de entrenamiento, en lugar de rastrear cosas en las neuronas del modelo, circuitos internos, ese tipo de cosas."

Este enfoque hace que OLMoTrace sea más práctico para aplicaciones empresariales, ya que no requiere un conocimiento profundo de la arquitectura de redes neuronales para entender los resultados.

Aplicaciones de IA empresarial: Desde el cumplimiento regulatorio hasta la depuración de modelos

Para las empresas que implementan IA en sectores regulados como la salud, las finanzas o los servicios legales, OLMoTrace ofrece beneficios significativos sobre los sistemas de caja negra tradicionales. "Creemos que OLMoTrace ayudará a los usuarios empresariales y comerciales a entender mejor qué se usa en el entrenamiento de los modelos para que puedan estar más confiados cuando quieran construir sobre ellos," afirmó Liu. "Esto puede ayudar a aumentar la transparencia y la confianza entre ellos en sus modelos, y también para los clientes en el comportamiento de sus modelos."

La tecnología permite varias capacidades clave para los equipos de IA empresarial:

  • Verificación de hechos de las salidas del modelo contra fuentes originales
  • Comprender los orígenes de las alucinaciones
  • Mejorar la depuración del modelo identificando patrones problemáticos
  • Mejorar el cumplimiento regulatorio mediante la trazabilidad de datos
  • Construir confianza con las partes interesadas mediante una mayor transparencia

El equipo de Ai2 ya ha utilizado OLMoTrace con buenos resultados. "Ya lo estamos usando para mejorar nuestros datos de entrenamiento," reveló Liu. "Cuando construimos OLMo 2 y comenzamos nuestro entrenamiento, a través de OLMoTrace, descubrimos que en realidad algunos de los datos de posentrenamiento no eran buenos."

Qué significa esto para la adopción de IA empresarial

Para las empresas que buscan estar a la vanguardia de la adopción de IA, OLMoTrace marca un avance significativo hacia sistemas de IA más responsables. La herramienta está disponible bajo una licencia de código abierto Apache 2.0, lo que significa que cualquier organización con acceso a los datos de entrenamiento de su modelo puede implementar capacidades de rastreo similares.

"OLMoTrace puede funcionar en cualquier modelo, siempre que tengas los datos de entrenamiento del modelo," señaló Liu. "Para modelos completamente abiertos donde todos tienen acceso a los datos de entrenamiento del modelo, cualquiera puede configurar OLMoTrace para ese modelo y para modelos propietarios, tal vez algunos proveedores no quieran liberar sus datos, ellos también pueden hacer este OLMoTrace internamente."

A medida que los marcos de gobernanza de IA global evolucionan, herramientas como OLMoTrace que permiten la verificación y la auditabilidad probablemente se convertirán en componentes cruciales de las pilas de IA empresarial, especialmente en industrias reguladas donde la transparencia es cada vez más requerida. Para los tomadores de decisiones técnicas que consideran los pros y los contras de la adopción de IA, OLMoTrace proporciona una manera práctica de implementar sistemas de IA más confiables y explicables sin comprometer el poder de los modelos de lenguaje grandes.

Artículo relacionado
Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE
La IA física se acerca cada vez más a las plantas de producción a medida que se realizan pruebas con robots humanoides La IA física se acerca cada vez más a las plantas de producción a medida que se realizan pruebas con robots humanoides Según Reuters, Humanoid, una empresa tecnológica británica, tiene previsto instalar robots humanoides en las fábricas del proveedor industrial alemán Schaeffler.Según un portavoz de Humanoid, se espe
OpenAI refuerza la seguridad de ChatGPT mediante una colaboración con Yubico para mejorar la protección de las cuentas OpenAI refuerza la seguridad de ChatGPT mediante una colaboración con Yubico para mejorar la protección de las cuentas OpenAI está tomando medidas importantes para mejorar la seguridad de las cuentas.El jueves, la empresa presentó «Advanced Account Security», un conjunto de protecciones opcionales para los usuarios de
Recomendaciones de temas especiales relacionados
Negocio Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos
Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos

Descubre las mejores herramientas de selección de personal basadas en IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada, incluye soluciones potentes y revolucionarias para la selección de currículos y la automatización de la programación de entrevistas con los candidatos. Compara las opciones gratuitas con las de pago gracias a pruebas reales y a clasificaciones que se actualizan semanalmente. ¡Encuentra tu asistente de selección de personal ideal y optimiza tu proceso de selección hoy mismo!

10 herramientas
xix.ai
Productividad Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental
Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental

Descubre los mejores entrenadores personales de bienestar y concentración basados en IA de 2026 en XIX.AI. Nuestras clasificaciones, cuidadosamente seleccionadas, incluyen herramientas revolucionarias y de primera categoría para gestionar el agotamiento y potenciar la energía mental. Compara las opciones gratuitas con las de pago gracias a información basada en casos reales. Descubre hoy mismo el camino hacia la máxima productividad y el bienestar.

10 herramientas
xix.ai
chatbot Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes
Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes

Descubre los mejores chatbots románticos con IA de 2026 para establecer relaciones auténticas y duraderas. Nuestra lista seleccionada incluye personalidades sólidas y coherentes, comparativas entre versiones gratuitas y de pago, y pruebas en situaciones reales. Encuentra a tu compañero ideal y empieza a construir tu relación hoy mismo en XIX.AI.

10 herramientas
xix.ai
Educación y aprendizaje Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.
Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.

Descubra a los mejores mentores en ciencia de datos y AI de 2026 para dominar SQL, Pandas y flujos de trabajo de aprendizaje automático. Explore nuestra selección cuidadosamente seleccionada y altamente valorada en XIX.AI para obtener orientación poderosa que cambie completamente la situación. Compare las opciones gratuitas con las pagadas y obtenga información basada en casos reales. Desbloquee su dominio de la ciencia de datos hoy mismo.

10 herramientas
xix.ai
chatbot Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real
Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real

Descubre los mejores cursos de 2026 sobre coqueteo y conversación con IA en XIX.AI. Nuestra selección, cuidadosamente seleccionada y con las mejores valoraciones, te ayuda a desarrollar tu carisma social y tu confianza en tiempo real. Explora herramientas imprescindibles y revolucionarias con comparativas entre versiones gratuitas y de pago, y clasificaciones que se actualizan semanalmente. Potencia hoy mismo tus habilidades sociales.

10 herramientas
xix.ai
código Las mejores herramientas de IA para pruebas unitarias automatizadas: genera casos de prueba con Jest, PyTest y JUnit con un solo clic
Las mejores herramientas de IA para pruebas unitarias automatizadas: genera casos de prueba con Jest, PyTest y JUnit con un solo clic

Descubre las mejores herramientas de IA de 2026 para la automatización de pruebas unitarias. Nuestra selección incluye potentes soluciones revolucionarias que permiten generar casos de prueba para Jest, PyTest y JUnit al instante. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones actualizadas semanalmente en XIX.AI. Aprovecha las ventajas de la IA y aumenta la productividad de tu desarrollo hoy mismo.

10 herramientas
xix.ai
comentario (9)
0/500
StevenWilson
StevenWilson 4 de junio de 2026 10:00:15 GMT+02:00

This is neat, but isn't it just giving researchers a fancy way to play "spot the plagiarism"? 🧐 I'd rather see them focus on making models less prone to hallucination in the first place.

AnthonyClark
AnthonyClark 25 de octubre de 2025 20:30:32 GMT+02:00

Наконец-то появился инструмент, который может отслеживать источники LLM! Это как детективная работа для ИИ 😄 Теперь предприятия смогут лучше понимать, откуда берутся ответы модели. Интересно, насколько точно он определяет первоисточники в обучающих данных?

RalphSanchez
RalphSanchez 12 de septiembre de 2025 14:30:46 GMT+02:00

Ai2의 이번 프로젝트 진짜 혁신적인 것 같아요! 🎯 LLM의 동작 원리를 파악할 수 있다면 기업에서 AI를 더 안전하게 활용할 수 있을 거예요. 다만 오픈소스라 하더라도 실제 적용이 얼마나 쉬울지 궁금하네요.

JackMitchell
JackMitchell 28 de julio de 2025 03:20:54 GMT+02:00

This OLMoTrace thing sounds pretty cool! Finally, a way to peek under the hood of LLMs and see what’s driving those outputs. I’m curious how it’ll handle messy real-world data though 🤔. Could be a game-changer for IT folks trying to make sense of AI black boxes.

GregoryAdams
GregoryAdams 22 de abril de 2025 21:58:18 GMT+02:00

OLMoTrace는 LLM의 내부를 들여다볼 수 있는 멋진 도구입니다. 훈련 데이터가 출력에 어떻게 영향을 미치는지 보는 것이 흥미롭습니다. 다만, 인터페이스가 좀 더 사용자 친화적이면 좋겠어요. 그래도, AI 투명성의 좋은 시작입니다! 👀

DonaldLee
DonaldLee 22 de abril de 2025 12:14:13 GMT+02:00

OLMoTrace is a cool tool for peeking under the hood of LLMs. It's fascinating to see how the training data influences the output. The interface could be more user-friendly though. Still, it's a great start for transparency in AI! 👀

OR