opção
Lar
Notícias
O que há dentro do LLM? Ai2 Olmotrace vai 'rastrear' a fonte

O que há dentro do LLM? Ai2 Olmotrace vai 'rastrear' a fonte

21 de Abril de 2025
106

O que há dentro do LLM? Ai2 Olmotrace vai 'rastrear' a fonte

Compreender a conexão entre a saída de um grande modelo de linguagem (LLM) e seus dados de treinamento sempre foi um pouco de quebra -cabeça para a empresa. Nesta semana, o Allen Institute for AI (AI2) lançou uma nova iniciativa emocionante de código aberto chamado Olmotrace, que visa desmistificar esse relacionamento. Ao permitir que os usuários rastreem as saídas do LLM de volta aos seus dados originais de treinamento, o Olmotrace aborda um dos maiores obstáculos à adoção da IA ​​corporativa: a falta de transparência nos processos de tomada de decisão da IA.

OLMO, que significa Modelo de Língua Aberta, é o nome da família de LLMs de código aberto da AI2. Você pode experimentar o Olmotrace com o mais recente modelo OLMO 2 32B no site de playground da AI2. Além disso, o código de código aberto está em disputa no Github, para que qualquer um possa usá-lo livremente.

O que diferencia o OLMOTRACE de outros métodos, como os focados nas pontuações da confiança ou na geração de recuperação, é que ele fornece uma visão clara de como as saídas do modelo se relacionam com os vastos conjuntos de dados de treinamento que os moldaram. Jiacheng Liu, pesquisador da AI2, disse à VentureBeat: "Nosso objetivo é ajudar os usuários a entender por que os modelos de idiomas geram as respostas que fazem".

Como funciona o Olmotrace: mais do que apenas citações

Embora os LLMs como perplexidade ou pesquisa de chatgpt possam oferecer citações de origem, eles operam de maneira diferente do Olmotrace. Segundo Liu, esses modelos usam a geração de recuperação de recuperação (RAG), que visa aprimorar a qualidade da saída do modelo, incorporando fontes adicionais além dos dados de treinamento. Por outro lado, o Olmotrace rastreia a saída do modelo diretamente de volta ao corpus de treinamento sem depender de documentos de pano ou externo.

A ferramenta identifica seqüências de texto exclusivas nas saídas do modelo e as correspondem a documentos específicos dos dados de treinamento. Quando uma correspondência é encontrada, o Olmotrace não apenas destaca o texto relevante, mas também fornece links para o material de origem original. Isso permite que os usuários vejam exatamente onde e como o modelo aprendeu as informações que ele usa.

Além das pontuações de confiança: evidência tangível de tomada de decisão de IA

Os LLMs geralmente geram saídas com base em pesos do modelo, que são usados ​​para calcular uma pontuação de confiança. Quanto maior a pontuação, mais supostamente precisa a saída. No entanto, Liu acredita que essas pontuações podem ser enganosas. "Os modelos podem confiar demais nas coisas que eles geram e, se você pedir que eles geram uma pontuação, geralmente é inflado", explicou. "É isso que os acadêmicos chamam de erro de calibração - a confiança de que os modelos de saída nem sempre refletem o quão precisa são suas respostas".

Em vez de confiar em pontuações potencialmente enganosas, a Olmotrace oferece evidências diretas das fontes de aprendizado do modelo, permitindo que os usuários façam julgamentos informados. "O que o Olmotrace faz é mostrar as correspondências entre as saídas do modelo e os documentos de treinamento", disse Liu. "Através da interface, você pode ver diretamente onde estão os pontos de correspondência e como os resultados do modelo coincidem com os documentos de treinamento".

Como o Olmotrace se compara a outras abordagens de transparência

O AI2 não é a única organização que trabalha para entender melhor as saídas do LLM. A antropia também conduziu pesquisas, mas seu foco está nas operações internas do modelo e não nos seus dados. Liu destacou a diferença: "Estamos adotando uma abordagem diferente deles. Estamos rastreando diretamente o comportamento do modelo, em seus dados de treinamento, em oposição a rastrear as coisas nos neurônios modelo, circuitos internos, esse tipo de coisa".

Essa abordagem torna o Olmotrace mais prático para aplicativos corporativos, pois não requer conhecimento profundo da arquitetura de rede neural para entender os resultados.

Aplicativos da IA ​​corporativa: da conformidade regulatória à depuração do modelo

Para empresas que implantam IA em setores regulamentados como serviços de saúde, finanças ou serviços jurídicos, a Olmotrace oferece benefícios significativos em relação aos sistemas tradicionais de caixa preta. "Achamos que o Olmotrace ajudará os usuários empresariais e empresariais a entender melhor o que é usado no treinamento dos modelos, para que eles possam estar mais confiantes quando desejam construir em cima deles", afirmou Liu. "Isso pode ajudar a aumentar a transparência e a confiança entre eles de seus modelos e também para os clientes de seus comportamentos modelo".

A tecnologia permite vários recursos importantes para as equipes da IA ​​corporativa:

  • Saídas do modelo de verificação de fatos contra fontes originais
  • Compreendendo as origens das alucinações
  • Melhorando a depuração do modelo, identificando padrões problemáticos
  • Melhorando a conformidade regulatória por meio de rastreabilidade de dados
  • Construindo confiança com as partes interessadas através do aumento da transparência

A equipe do AI2 já colocou o Olmotrace em bom uso. "Já estamos usando para melhorar nossos dados de treinamento", revelou Liu. "Quando construímos o Olmo 2 e iniciamos nosso treinamento, através da Olmotrace, descobrimos que na verdade alguns dos dados pós-treinamento não eram bons".

O que isso significa para a adoção da IA ​​corporativa

Para as empresas que visam estar na vanguarda da adoção de IA, a OLMOTRACE marca um avanço significativo em relação aos sistemas de IA mais responsáveis. A ferramenta está disponível sob uma licença de código aberto Apache 2.0, o que significa que qualquer organização com acesso aos dados de treinamento de seu modelo pode implementar recursos de rastreamento semelhantes.

"O Olmotrace pode funcionar em qualquer modelo, desde que você tenha os dados de treinamento do modelo", observou Liu. "Para modelos totalmente abertos, onde todos têm acesso aos dados de treinamento do modelo, qualquer pessoa pode configurar o OLMOTRACE para esse modelo e para modelos proprietários, talvez alguns provedores não queiram lançar seus dados, eles também podem fazer esse olmotrato internamente".

À medida que as estruturas globais de governança da IA ​​evoluem, é provável que ferramentas como o OLMOTRACE que permitam a verificação e auditabilidade se tornem componentes cruciais das pilhas de IA corporativa, especialmente em indústrias regulamentadas onde a transparência é cada vez mais necessária. Para os tomadores de decisão técnicos, considerando os prós e os contras da adoção de IA, o Olmotrace fornece uma maneira prática de implementar sistemas de IA mais confiáveis ​​e explicáveis, sem comprometer o poder de grandes modelos de linguagem.

Artigo relacionado
DeepSeek AI挑戰Chatgpt並塑造了AI的未來 DeepSeek AI挑戰Chatgpt並塑造了AI的未來 DeepSeek AI的興起:AI Landscapeart人工智能中的新篇章一直處於不斷變化狀態,新參與者每天都在挑戰現狀。其中,DeepSeek AI已成為著名的競爭者,尤其是在App Store下載中超過Chatgpt之後。這個mi
朱利葉斯AI:用計算智能徹底改變數據分析 朱利葉斯AI:用計算智能徹底改變數據分析 在當今以數據為中心的世界中,數據分析在做出明智的決策中起著關鍵作用。但是,對於許多人來說,這個過程仍然令人生畏和耗時。輸入Julius AI,這是一種革命性的計算AI工具
AI烹飪視頻很容易使用Leonardo AI和Chatgpt創建 AI烹飪視頻很容易使用Leonardo AI和Chatgpt創建 用YouTube和Tiktok等平台的配樂吸引人的烹飪內容來徹底改變烹飪視頻,這並不一定像是一個永無止境的項目。得益於人工智能的進步,此過程變得更加容易。本指南將引導您瀏覽最簡單的方法
Comentários (5)
0/200
DonaldLee
DonaldLee 22 de Abril de 2025 à0 00:00:00 GMT

OLMoTrace is a cool tool for peeking under the hood of LLMs. It's fascinating to see how the training data influences the output. The interface could be more user-friendly though. Still, it's a great start for transparency in AI! 👀

NicholasClark
NicholasClark 22 de Abril de 2025 à0 00:00:00 GMT

OLMoTraceはLLMの内部を覗くための素晴らしいツールです。トレーニングデータが出力にどのように影響するかを見るのは興味深いです。ただ、インターフェースがもう少しユーザーフレンドリーだといいですね。それでも、AIの透明性のための良いスタートです!👀

GregoryAdams
GregoryAdams 23 de Abril de 2025 à0 00:00:00 GMT

OLMoTrace는 LLM의 내부를 들여다볼 수 있는 멋진 도구입니다. 훈련 데이터가 출력에 어떻게 영향을 미치는지 보는 것이 흥미롭습니다. 다만, 인터페이스가 좀 더 사용자 친화적이면 좋겠어요. 그래도, AI 투명성의 좋은 시작입니다! 👀

MichaelDavis
MichaelDavis 22 de Abril de 2025 à0 00:00:00 GMT

OLMoTrace é uma ferramenta legal para dar uma olhada no funcionamento interno dos LLMs. É fascinante ver como os dados de treinamento influenciam a saída. A interface poderia ser mais amigável, no entanto. Ainda assim, é um ótimo começo para a transparência em IA! 👀

PaulTaylor
PaulTaylor 22 de Abril de 2025 à0 00:00:00 GMT

OLMoTrace es una herramienta genial para echar un vistazo bajo el capó de los LLMs. Es fascinante ver cómo los datos de entrenamiento influyen en la salida. La interfaz podría ser más amigable para el usuario, sin embargo. Aún así, es un gran comienzo para la transparencia en la IA! 👀

De volta ao topo
OR