Qu'y a-t-il à l'intérieur du LLM? Ai2 olmotrace «retracera» la source

Maison

Nouvelles

21 avril 2025

LawrenceJones

141

# Data # ChatGPT # ai2 # GitHub # ai-data # ai-trust # ai2-olmo

Qu'y a-t-il à l'intérieur du LLM? Ai2 olmotrace «retracera» la source

Comprendre la connexion entre la sortie d'un grand modèle de langage (LLM) et ses données d'entraînement a toujours été un peu un casse-tête pour les TI d'entreprise. Cette semaine, l'Allen Institute for AI (Ai2) a lancé une nouvelle initiative open-source passionnante appelée OLMoTrace, qui vise à démystifier cette relation. En permettant aux utilisateurs de retracer les sorties des LLM jusqu'à leurs données d'entraînement originales, OLMoTrace s'attaque à l'un des plus grands obstacles à l'adoption de l'IA en entreprise : le manque de transparence dans les processus de prise de décision de l'IA.

OLMo, qui signifie Open Language Model, est le nom de la famille de LLM open-source d'Ai2. Vous pouvez essayer OLMoTrace avec le dernier modèle OLMo 2 32B sur le site Playground d'Ai2. De plus, le code open-source est disponible sur GitHub, donc tout le monde peut l'utiliser librement.

Ce qui distingue OLMoTrace des autres méthodes, comme celles axées sur les scores de confiance ou la génération augmentée par récupération, c'est qu'il offre une vue claire sur la manière dont les sorties du modèle sont liées aux vastes ensembles de données d'entraînement qui les ont façonnées. Jiacheng Liu, chercheur chez Ai2, a déclaré à VentureBeat : « Notre objectif est d'aider les utilisateurs à comprendre pourquoi les modèles de langage génèrent les réponses qu'ils produisent. »

Comment fonctionne OLMoTrace : Plus que de simples citations

Alors que des LLM comme Perplexity ou ChatGPT Search peuvent offrir des citations de sources, ils fonctionnent différemment d'OLMoTrace. Selon Liu, ces modèles utilisent la génération augmentée par récupération (RAG), qui vise à améliorer la qualité de la sortie du modèle en incorporant des sources supplémentaires au-delà des données d'entraînement. En revanche, OLMoTrace retrace la sortie du modèle directement vers le corpus d'entraînement sans s'appuyer sur RAG ou des documents externes.

L'outil identifie des séquences de texte uniques dans les sorties du modèle et les associe à des documents spécifiques des données d'entraînement. Lorsqu'une correspondance est trouvée, OLMoTrace non seulement met en évidence le texte pertinent, mais fournit également des liens vers le matériel source original. Cela permet aux utilisateurs de voir exactement où et comment le modèle a appris les informations qu'il utilise.

Au-delà des scores de confiance : Preuves tangibles de la prise de décision de l'IA

Les LLM génèrent généralement des sorties basées sur les poids du modèle, qui sont utilisés pour calculer un score de confiance. Plus le score est élevé, plus la sortie est supposée précise. Cependant, Liu estime que ces scores peuvent être trompeurs. « Les modèles peuvent être trop confiants dans ce qu'ils génèrent, et si vous leur demandez de générer un score, il est généralement gonflé », a-t-il expliqué. « C'est ce que les universitaires appellent une erreur de calibration—la confiance que les modèles affichent ne reflète pas toujours la précision réelle de leurs réponses. »

Au lieu de s'appuyer sur des scores potentiellement trompeurs, OLMoTrace offre des preuves directes des sources d'apprentissage du modèle, permettant aux utilisateurs de porter des jugements éclairés. « Ce que fait OLMoTrace, c'est vous montrer les correspondances entre les sorties du modèle et les documents d'entraînement », a déclaré Liu. « Grâce à l'interface, vous pouvez voir directement où se trouvent les points de correspondance et comment les sorties du modèle coïncident avec les documents d'entraînement. »

Comment OLMoTrace se compare aux autres approches de transparence

Ai2 n'est pas la seule organisation à travailler pour mieux comprendre les sorties des LLM. Anthropic a également mené des recherches, mais leur focus a été sur les opérations internes du modèle plutôt que sur ses données. Liu a souligné la différence : « Nous adoptons une approche différente de la leur. Nous retraçons directement le comportement du modèle, dans ses données d'entraînement, plutôt que de retracer les choses dans les neurones du modèle, les circuits internes, ce genre de choses. »

Cette approche rend OLMoTrace plus pratique pour les applications en entreprise, car elle ne nécessite pas une connaissance approfondie de l'architecture des réseaux neuronaux pour comprendre les résultats.

Applications de l'IA en entreprise : De la conformité réglementaire au débogage de modèles

Pour les entreprises déployant l'IA dans des secteurs réglementés comme la santé, la finance ou les services juridiques, OLMoTrace offre des avantages significatifs par rapport aux systèmes traditionnels en boîte noire. « Nous pensons qu'OLMoTrace aidera les utilisateurs d'entreprise à mieux comprendre ce qui est utilisé dans l'entraînement des modèles afin qu'ils puissent être plus confiants lorsqu'ils souhaitent s'appuyer dessus », a déclaré Liu. « Cela peut aider à augmenter la transparence et la confiance entre eux vis-à-vis de leurs modèles, ainsi que pour les clients concernant le comportement de leurs modèles. »

La technologie permet plusieurs capacités clés pour les équipes d'IA en entreprise :

Vérification des faits des sorties du modèle par rapport aux sources originales
Compréhension des origines des hallucinations
Amélioration du débogage de modèles en identifiant les motifs problématiques
Renforcement de la conformité réglementaire grâce à la traçabilité des données
Renforcement de la confiance avec les parties prenantes grâce à une transparence accrue

L'équipe d'Ai2 a déjà mis OLMoTrace à bon usage. « Nous l'utilisons déjà pour améliorer nos données d'entraînement », a révélé Liu. « Lorsque nous avons construit OLMo 2 et commencé notre entraînement, grâce à OLMoTrace, nous avons découvert que certaines des données post-entraînement n'étaient pas bonnes. »

Ce que cela signifie pour l'adoption de l'IA en entreprise

Pour les entreprises visant à être à la pointe de l'adoption de l'IA, OLMoTrace marque une avancée significative vers des systèmes d'IA plus responsables. L'outil est disponible sous une licence open-source Apache 2.0, ce qui signifie que toute organisation ayant accès aux données d'entraînement de son modèle peut mettre en œuvre des capacités de traçage similaires.

« OLMoTrace peut fonctionner sur n'importe quel modèle, tant que vous avez les données d'entraînement du modèle », a noté Liu. « Pour les modèles entièrement ouverts où tout le monde a accès aux données d'entraînement du modèle, n'importe qui peut configurer OLMoTrace pour ce modèle et pour les modèles propriétaires, peut-être que certains fournisseurs ne veulent pas divulguer leurs données, ils peuvent également faire ce OLMoTrace en interne. »

À mesure que les cadres mondiaux de gouvernance de l'IA évoluent, des outils comme OLMoTrace, qui permettent la vérification et l'auditabilité, sont susceptibles de devenir des composants cruciaux des piles d'IA en entreprise, en particulier dans les industries réglementées où la transparence est de plus en plus requise. Pour les décideurs techniques évaluant les avantages et les inconvénients de l'adoption de l'IA, OLMoTrace offre une manière pratique de mettre en œuvre des systèmes d'IA plus fiables et explicables sans compromettre la puissance des grands modèles de langage.

Article connexe

Stratégie d'IA d'Adobe : Gagnants et perdants dans la course technologique Dans le monde en rapide évolution de l'intelligence artificielle (IA), les investisseurs surveillent de près quelles entreprises prospéreront dans cette transformation technologique. Cet article exami

OpenAI s'engage à corriger après les réponses trop conciliantes de ChatGPT OpenAI prévoit de réviser son processus de mise à jour du modèle AI pour ChatGPT après qu'une mise à jour a provoqué des réponses excessivement flatteuses, suscitant de nombreux retours d'utilisateurs

OpenAI Dévoile des Modèles d'IA Avancés pour le Raisonnement, o3 et o4-mini OpenAI a présenté mercredi o3 et o4-mini, de nouveaux modèles d'IA conçus pour faire une pause et analyser les questions avant de répondre.OpenAI présente o3 comme son modèle de raisonnement le plus s

commentaires (6)

0/200

Soumettre

JackMitchell

28 juillet 2025 03:20:54 UTC+02:00

This OLMoTrace thing sounds pretty cool! Finally, a way to peek under the hood of LLMs and see what’s driving those outputs. I’m curious how it’ll handle messy real-world data though 🤔. Could be a game-changer for IT folks trying to make sense of AI black boxes.

GregoryAdams

22 avril 2025 21:58:18 UTC+02:00

OLMoTrace는 LLM의 내부를 들여다볼 수 있는 멋진 도구입니다. 훈련 데이터가 출력에 어떻게 영향을 미치는지 보는 것이 흥미롭습니다. 다만, 인터페이스가 좀 더 사용자 친화적이면 좋겠어요. 그래도, AI 투명성의 좋은 시작입니다! 👀

DonaldLee

22 avril 2025 12:14:13 UTC+02:00

OLMoTrace is a cool tool for peeking under the hood of LLMs. It's fascinating to see how the training data influences the output. The interface could be more user-friendly though. Still, it's a great start for transparency in AI! 👀

PaulTaylor

22 avril 2025 09:01:43 UTC+02:00

OLMoTrace es una herramienta genial para echar un vistazo bajo el capó de los LLMs. Es fascinante ver cómo los datos de entrenamiento influyen en la salida. La interfaz podría ser más amigable para el usuario, sin embargo. Aún así, es un gran comienzo para la transparencia en la IA! 👀

MichaelDavis

21 avril 2025 23:38:04 UTC+02:00

OLMoTrace é uma ferramenta legal para dar uma olhada no funcionamento interno dos LLMs. É fascinante ver como os dados de treinamento influenciam a saída. A interface poderia ser mais amigável, no entanto. Ainda assim, é um ótimo começo para a transparência em IA! 👀

NicholasClark

21 avril 2025 23:02:50 UTC+02:00

OLMoTraceはLLMの内部を覗くための素晴らしいツールです。トレーニングデータが出力にどのように影響するかを見るのは興味深いです。ただ、インターフェースがもう少しユーザーフレンドリーだといいですね。それでも、AIの透明性のための良いスタートです！👀

Top nouvelles

Gemini 2.5 Pro maintenant illimité et moins cher que Claude, GPT-4O Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives Doublage par IA : Guide ultime pour la création de voix réalistes OpenAI améliore l'assistant vocal AI pour de meilleurs chats Notebooklm se développe à l'échelle mondiale, ajoute des diapositives et une vérification des faits améliorée Les ajustements aux centres de données américains pourraient débloquer 76 GW de nouvelle capacité d'énergie L'informatique de l'IA pour consommer la puissance de plusieurs New York d'ici 2026, explique le fondateur Clonage Vocal IA: Guide Ultime pour Maîtriser la Conversion de Voix Découvrez les mots croisés d'E / S propulsés par l'IA: une touche moderne sur le jeu de mots classique Le PDG de Nvidia clarifie les idées fausses sur l'impact du marché de Deepseek

Plus

En vedette