opción
Hogar Noticias ¿Qué hay dentro del LLM? Ai2 Olmotrace 'rastreará' la fuente

¿Qué hay dentro del LLM? Ai2 Olmotrace 'rastreará' la fuente

Fecha de lanzamiento Fecha de lanzamiento 21 de abril de 2025
Autor Autor LawrenceJones
vistas vistas 59

¿Qué hay dentro del LLM? Ai2 Olmotrace 'rastreará' la fuente

Comprender la conexión entre la salida de un modelo de lenguaje grande (LLM) y sus datos de entrenamiento siempre ha sido un poco rompecabezas para Enterprise IT. Esta semana, el Allen Institute for AI (AI2) lanzó una nueva y emocionante iniciativa de código abierto llamada Olmotrace, que tiene como objetivo desmitificar esta relación. Al permitir que los usuarios rastreen las salidas de LLM a sus datos de entrenamiento originales, Olmotrace aborda uno de los mayores obstáculos a la adopción empresarial de IA: la falta de transparencia en los procesos de toma de decisiones de IA.

OLMO, que representa el modelo de lenguaje abierto, es el nombre de la familia de LLM de código abierto de AI2. Puede probar Olmotrace con el último modelo OLMO 2 32B en el sitio de juegos de AI2. Además, el código de código abierto está en juego en Github, por lo que cualquiera puede usarlo libremente.

Lo que distingue a Olmotrace de otros métodos, como los que se centran en los puntajes de confianza o la generación de recuperación, es que proporciona una visión clara de cómo las salidas del modelo se relacionan con los vastos conjuntos de datos de entrenamiento que los dieron forma. Jiacheng Liu, investigador de AI2, dijo a VentureBeat: "Nuestro objetivo es ayudar a los usuarios a comprender por qué los modelos de lenguaje generan las respuestas que hacen".

Cómo funciona Olmotrace: más que solo citas

Si bien los LLM como la perplejidad o la búsqueda ChatGPT pueden ofrecer citas de origen, operan de manera diferente a Olmotrace. Según Liu, estos modelos utilizan la generación de recuperación acuática (RAG), cuyo objetivo es mejorar la calidad del resultado del modelo al incorporar fuentes adicionales más allá de los datos de capacitación. Por otro lado, Olmotrace traza la salida del modelo directamente de regreso al corpus de entrenamiento sin confiar en trapo o documentos externos.

La herramienta identifica secuencias de texto únicas en las salidas del modelo y las coincide con documentos específicos de los datos de capacitación. Cuando se encuentra una coincidencia, Olmotrace no solo resalta el texto relevante, sino que también proporciona enlaces al material fuente original. Esto permite a los usuarios ver exactamente dónde y cómo el modelo aprendió la información que utiliza.

Más allá de los puntajes de la confianza: evidencia tangible de la toma de decisiones de IA

Los LLM generalmente generan salidas basadas en pesos del modelo, que se utilizan para calcular una puntuación de confianza. Cuanto mayor sea la puntuación, más supuestamente precisa es la salida. Sin embargo, Liu cree que estos puntajes pueden ser engañosos. "Los modelos pueden estar demasiado confiados en las cosas que generan, y si les pide que generen una puntuación, generalmente está inflado", explicó. "Eso es lo que los académicos llaman un error de calibración: la confianza de que la salida de los modelos no siempre refleja cuán precisas son realmente sus respuestas".

En lugar de confiar en puntajes potencialmente engañosos, Olmotrace ofrece evidencia directa de las fuentes de aprendizaje del modelo, lo que permite a los usuarios emitir juicios informados. "Lo que hace Olmotrace es mostrarle las coincidencias entre las salidas del modelo y los documentos de entrenamiento", dijo Liu. "A través de la interfaz, puede ver directamente dónde están los puntos de coincidencia y cómo las salidas del modelo coinciden con los documentos de entrenamiento".

Cómo Olmotrace se compara con otros enfoques de transparencia

AI2 no es la única organización que trabaja para comprender mejor las salidas de LLM. Anthrope también ha realizado investigaciones, pero su enfoque ha estado en las operaciones internas del modelo en lugar de sus datos. Liu destacó la diferencia: "Estamos adoptando un enfoque diferente de ellos. Estamos rastreando directamente en el comportamiento del modelo, en sus datos de entrenamiento, en lugar de rastrear cosas en las neuronas modelo, circuitos internos, ese tipo de cosas".

Este enfoque hace que Olmotrace sea más práctica para las aplicaciones empresariales, ya que no requiere un conocimiento profundo de la arquitectura de redes neuronales para comprender los resultados.

Aplicaciones empresariales de IA: desde el cumplimiento regulatorio hasta la depuración del modelo

Para las empresas que implementan IA en sectores regulados como la atención médica, las finanzas o los servicios legales, Olmotrace ofrece beneficios significativos sobre los sistemas tradicionales de caja negra. "Creemos que Olmotrace ayudará a los usuarios empresariales y comerciales a comprender mejor lo que se usa en la capacitación de los modelos para que puedan tener más confianza cuando quieran construir sobre ellos", dijo Liu. "Esto puede ayudar a aumentar la transparencia y la confianza entre ellos de sus modelos, y también para los clientes de sus comportamientos de modelo".

La tecnología permite varias capacidades clave para equipos de IA empresariales:

  • Sutens de modelo de verificación de hechos contra fuentes originales
  • Comprender los orígenes de las alucinaciones
  • Mejora de la depuración del modelo identificando patrones problemáticos
  • Mejorar el cumplimiento regulatorio a través de la trazabilidad de los datos
  • Creación de confianza con las partes interesadas a través de una mayor transparencia

El equipo AI2 ya ha usado a Olmotrace. "Ya lo estamos usando para mejorar nuestros datos de entrenamiento", reveló Liu. "Cuando construimos Olmo 2 y comenzamos nuestro entrenamiento, a través de Olmotrace, descubrimos que en realidad algunos de los datos posteriores al entrenamiento no eran buenos".

Lo que esto significa para la adopción empresarial de IA

Para las empresas que pretenden estar a la vanguardia de la adopción de IA, Olmotrace marca un avance significativo hacia sistemas de IA más responsables. La herramienta está disponible bajo una licencia de código abierto Apache 2.0, lo que significa que cualquier organización con acceso a los datos de capacitación de su modelo puede implementar capacidades de rastreo similares.

"Olmotrace puede trabajar en cualquier modelo, siempre que tenga los datos de entrenamiento del modelo", señaló Liu. "Para modelos completamente abiertos donde todos tienen acceso a los datos de capacitación del modelo, cualquiera puede configurar Olmotrace para ese modelo y para modelos propietarios, tal vez algunos proveedores no quieran liberar sus datos, también pueden hacer esta Olmotrace internamente".

A medida que evolucionan los marcos de gobernanza de IA globales, es probable que herramientas como Olmotrace que permitan la verificación y la auditabilidad se conviertan en componentes cruciales de las pilas de IA empresariales, especialmente en las industrias reguladas donde se requiere cada vez más transparencia. Para los tomadores de decisiones técnicas que consideran los pros y los contras de la adopción de IA, Olmotrace proporciona una forma práctica de implementar sistemas de IA más confiables y explicables sin comprometer el poder de los modelos de idiomas grandes.

Artículo relacionado
배치 데이터 처리는 실시간 AI에 비해 너무 느립니다. 오픈 소스 Apache Airflow 3.0이 이벤트 중심의 데이터 오케스트레이션으로 도전을 해결하는 방법 배치 데이터 처리는 실시간 AI에 비해 너무 느립니다. 오픈 소스 Apache Airflow 3.0이 이벤트 중심의 데이터 오케스트레이션으로 도전을 해결하는 방법 다양한 소스에서 AI 애플리케이션에 적합한 장소로 데이터를 이동하는 것은 작은 위업이 아닙니다. 이곳은 Apache Airflow와 같은 데이터 오케스트레이션 도구가 작동하여 프로세스를 더 부드럽고 효율적으로 만듭니다. Apache Airflow Community는 Ye에서 가장 중요한 업데이트를 방금 출시했습니다.
전 Deepseeker 및 Collaborators는 신뢰할 수있는 AI 에이전트를 훈련하기위한 새로운 방법을 발표합니다 : Ragen 전 Deepseeker 및 Collaborators는 신뢰할 수있는 AI 에이전트를 훈련하기위한 새로운 방법을 발표합니다 : Ragen AI 에이전트의 해 : 2025 년의 기대와 현실 2025를 자세히 살펴보면 AI 에이전트가 OpenAi, Anthropic, Google 및 Deepseek와 같은 회사의 고급 대형 언어 및 멀티 모달 모델로 구동되는 AI 시스템에 따라 AI 에이전트가 구체화 된 해로 많은 전문가들에 의해 예고되었습니다.
Claude 3.5 Sonnet은 Chatgpt가 지배하는 AI 코딩 테스트에서 창의적으로 투쟁 Claude 3.5 Sonnet은 Chatgpt가 지배하는 AI 코딩 테스트에서 창의적으로 투쟁 Anthropic의 New Claude 3.5 Sonnetlast Week의 기능을 테스트하면서 Claude 3.5 Sonnet의 출시를 알리는 전자 메일을 받았습니다. 그들은 "인텔리전스의 업계 바를 높이고, 경쟁 업체 모델을 능가하고, 광범위한 평가에 대한 클로드 3 Opus"라고 자랑했습니다. 티
comentario (0)
0/200
Volver arriba
OR