¿Qué hay dentro del LLM? Ai2 Olmotrace 'rastreará' la fuente

Hogar

Noticias

21 de abril de 2025

LawrenceJones

141

# Data # ChatGPT # ai2 # GitHub # ai-data # ai-trust # ai2-olmo

¿Qué hay dentro del LLM? Ai2 Olmotrace 'rastreará' la fuente

Comprender la conexión entre la salida de un modelo de lenguaje grande (LLM) y sus datos de entrenamiento siempre ha sido un poco un rompecabezas para la TI empresarial. Esta semana, el Allen Institute for AI (Ai2) lanzó una emocionante nueva iniciativa de código abierto llamada OLMoTrace, que busca desmitificar esta relación. Al permitir a los usuarios rastrear las salidas de los LLM hasta sus datos de entrenamiento originales, OLMoTrace aborda uno de los mayores obstáculos para la adopción de la IA empresarial: la falta de transparencia en los procesos de toma de decisiones de la IA.

OLMo, que significa Modelo de Lenguaje Abierto, es el nombre de la familia de LLMs de código abierto de Ai2. Puedes probar OLMoTrace con el último modelo OLMo 2 32B en el sitio Playground de Ai2. Además, el código de fuente abierta está disponible en GitHub, por lo que cualquiera puede usarlo libremente.

Lo que distingue a OLMoTrace de otros métodos, como aquellos que se centran en puntajes de confianza o generación aumentada por recuperación, es que proporciona una visión clara de cómo las salidas del modelo se relacionan con los vastos conjuntos de datos de entrenamiento que los formaron. Jiacheng Liu, un investigador de Ai2, dijo a VentureBeat: "Nuestro objetivo es ayudar a los usuarios a entender por qué los modelos de lenguaje generan las respuestas que generan."

Cómo funciona OLMoTrace: Más que solo citas

Mientras que LLMs como Perplexity o ChatGPT Search pueden ofrecer citas de fuentes, operan de manera diferente a OLMoTrace. Según Liu, estos modelos utilizan generación aumentada por recuperación (RAG), que busca mejorar la calidad de la salida del modelo incorporando fuentes adicionales más allá de los datos de entrenamiento. Por otro lado, OLMoTrace rastrea la salida del modelo directamente hasta el corpus de entrenamiento sin depender de RAG o documentos externos.

La herramienta identifica secuencias de texto únicas en las salidas del modelo y las empareja con documentos específicos de los datos de entrenamiento. Cuando se encuentra una coincidencia, OLMoTrace no solo resalta el texto relevante, sino que también proporciona enlaces al material de la fuente original. Esto permite a los usuarios ver exactamente dónde y cómo el modelo aprendió la información que utiliza.

Más allá de los puntajes de confianza: Evidencia tangible de la toma de decisiones de la IA

Los LLMs normalmente generan salidas basadas en los pesos del modelo, que se utilizan para calcular un puntaje de confianza. Cuanto mayor es el puntaje, supuestamente más precisa es la salida. Sin embargo, Liu cree que estos puntajes pueden ser engañosos. "Los modelos pueden estar demasiado confiados en lo que generan, y si les pides que generen un puntaje, suele estar inflado," explicó. "Eso es lo que los académicos llaman un error de calibración: la confianza que los modelos muestran no siempre refleja cuán precisas son realmente sus respuestas."

En lugar de depender de puntajes potencialmente engañosos, OLMoTrace ofrece evidencia directa de las fuentes de aprendizaje del modelo, permitiendo a los usuarios hacer juicios informados. "Lo que hace OLMoTrace es mostrar las coincidencias entre las salidas del modelo y los documentos de entrenamiento," dijo Liu. "A través de la interfaz, puedes ver directamente dónde están los puntos de coincidencia y cómo las salidas del modelo coinciden con los documentos de entrenamiento."

Cómo se compara OLMoTrace con otros enfoques de transparencia

Ai2 no es la única organización trabajando para comprender mejor las salidas de los LLM. Anthropic también ha realizado investigaciones, pero su enfoque ha estado en las operaciones internas del modelo más que en sus datos. Liu destacó la diferencia: "Estamos tomando un enfoque diferente al de ellos. Estamos rastreando directamente el comportamiento del modelo, sus datos de entrenamiento, en lugar de rastrear cosas en las neuronas del modelo, circuitos internos, ese tipo de cosas."

Este enfoque hace que OLMoTrace sea más práctico para aplicaciones empresariales, ya que no requiere un conocimiento profundo de la arquitectura de redes neuronales para entender los resultados.

Aplicaciones de IA empresarial: Desde el cumplimiento regulatorio hasta la depuración de modelos

Para las empresas que implementan IA en sectores regulados como la salud, las finanzas o los servicios legales, OLMoTrace ofrece beneficios significativos sobre los sistemas de caja negra tradicionales. "Creemos que OLMoTrace ayudará a los usuarios empresariales y comerciales a entender mejor qué se usa en el entrenamiento de los modelos para que puedan estar más confiados cuando quieran construir sobre ellos," afirmó Liu. "Esto puede ayudar a aumentar la transparencia y la confianza entre ellos en sus modelos, y también para los clientes en el comportamiento de sus modelos."

La tecnología permite varias capacidades clave para los equipos de IA empresarial:

Verificación de hechos de las salidas del modelo contra fuentes originales
Comprender los orígenes de las alucinaciones
Mejorar la depuración del modelo identificando patrones problemáticos
Mejorar el cumplimiento regulatorio mediante la trazabilidad de datos
Construir confianza con las partes interesadas mediante una mayor transparencia

El equipo de Ai2 ya ha utilizado OLMoTrace con buenos resultados. "Ya lo estamos usando para mejorar nuestros datos de entrenamiento," reveló Liu. "Cuando construimos OLMo 2 y comenzamos nuestro entrenamiento, a través de OLMoTrace, descubrimos que en realidad algunos de los datos de posentrenamiento no eran buenos."

Qué significa esto para la adopción de IA empresarial

Para las empresas que buscan estar a la vanguardia de la adopción de IA, OLMoTrace marca un avance significativo hacia sistemas de IA más responsables. La herramienta está disponible bajo una licencia de código abierto Apache 2.0, lo que significa que cualquier organización con acceso a los datos de entrenamiento de su modelo puede implementar capacidades de rastreo similares.

"OLMoTrace puede funcionar en cualquier modelo, siempre que tengas los datos de entrenamiento del modelo," señaló Liu. "Para modelos completamente abiertos donde todos tienen acceso a los datos de entrenamiento del modelo, cualquiera puede configurar OLMoTrace para ese modelo y para modelos propietarios, tal vez algunos proveedores no quieran liberar sus datos, ellos también pueden hacer este OLMoTrace internamente."

A medida que los marcos de gobernanza de IA global evolucionan, herramientas como OLMoTrace que permiten la verificación y la auditabilidad probablemente se convertirán en componentes cruciales de las pilas de IA empresarial, especialmente en industrias reguladas donde la transparencia es cada vez más requerida. Para los tomadores de decisiones técnicas que consideran los pros y los contras de la adopción de IA, OLMoTrace proporciona una manera práctica de implementar sistemas de IA más confiables y explicables sin comprometer el poder de los modelos de lenguaje grandes.

Artículo relacionado

Estrategia de IA de Adobe: Ganadores y perdedores en la carrera tecnológica En el mundo rápidamente cambiante de la inteligencia artificial (IA), los inversores observan de cerca qué empresas prosperarán en esta transformación tecnológica. Este artículo examina el enfoque de

OpenAI se Compromete a Realizar Correcciones Tras las Respuestas Excesivamente Complacientes de ChatGPT OpenAI planea revisar su proceso de actualización del modelo de IA para ChatGPT después de que una actualización provocara respuestas excesivamente sycophantic, generando amplios comentarios de los us

OpenAI Presenta Modelos Avanzados de Razonamiento de IA, o3 y o4-mini OpenAI presentó o3 y o4-mini el miércoles, nuevos modelos de IA diseñados para pausar y analizar preguntas antes de responder.OpenAI destaca o3 como su modelo de razonamiento más sofisticado hasta aho

comentario (6)

0/200

Entregar

JackMitchell

28 de julio de 2025 03:20:54 GMT+02:00

This OLMoTrace thing sounds pretty cool! Finally, a way to peek under the hood of LLMs and see what’s driving those outputs. I’m curious how it’ll handle messy real-world data though 🤔. Could be a game-changer for IT folks trying to make sense of AI black boxes.

GregoryAdams

22 de abril de 2025 21:58:18 GMT+02:00

OLMoTrace는 LLM의 내부를 들여다볼 수 있는 멋진 도구입니다. 훈련 데이터가 출력에 어떻게 영향을 미치는지 보는 것이 흥미롭습니다. 다만, 인터페이스가 좀 더 사용자 친화적이면 좋겠어요. 그래도, AI 투명성의 좋은 시작입니다! 👀

DonaldLee

22 de abril de 2025 12:14:13 GMT+02:00

OLMoTrace is a cool tool for peeking under the hood of LLMs. It's fascinating to see how the training data influences the output. The interface could be more user-friendly though. Still, it's a great start for transparency in AI! 👀

PaulTaylor

22 de abril de 2025 09:01:43 GMT+02:00

OLMoTrace es una herramienta genial para echar un vistazo bajo el capó de los LLMs. Es fascinante ver cómo los datos de entrenamiento influyen en la salida. La interfaz podría ser más amigable para el usuario, sin embargo. Aún así, es un gran comienzo para la transparencia en la IA! 👀

MichaelDavis

21 de abril de 2025 23:38:04 GMT+02:00

OLMoTrace é uma ferramenta legal para dar uma olhada no funcionamento interno dos LLMs. É fascinante ver como os dados de treinamento influenciam a saída. A interface poderia ser mais amigável, no entanto. Ainda assim, é um ótimo começo para a transparência em IA! 👀

NicholasClark

21 de abril de 2025 23:02:50 GMT+02:00

OLMoTraceはLLMの内部を覗くための素晴らしいツールです。トレーニングデータが出力にどのように影響するかを見るのは興味深いです。ただ、インターフェースがもう少しユーザーフレンドリーだといいですね。それでも、AIの透明性のための良いスタートです！👀

Noticias principales

Gemini 2.5 Pro ahora ilimitado y más barato que Claude, GPT-4O Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Doblaje AI: Guía Definitiva para la Creación de Voz Realista Operai mejora el asistente de voz de IA para mejores chats Notebooklm se expande a nivel mundial, agrega diapositivas y verificación de hechos mejorada Los ajustes a los centros de datos de EE. UU. Podrían desbloquear 76 GW de nueva capacidad de potencia AI Computing para consumir la potencia de múltiples NYC para 2026, dice el fundador Clonación de Voz IA: La guía definitiva para dominar la conversión de voz Experimente el crucigrama de E/S con IA: un giro moderno en el clásico juego de palabras El CEO de NVIDIA aclara los conceptos erróneos sobre el impacto del mercado de Deepseek

Más

Presentado