O que há dentro do LLM? Ai2 Olmotrace vai 'rastrear' a fonte

Lar

Notícias

21 de Abril de 2025

LawrenceJones

141

# Data # ChatGPT # ai2 # GitHub # ai-data # ai-trust # ai2-olmo

O que há dentro do LLM? Ai2 Olmotrace vai 'rastrear' a fonte

Compreender a conexão entre a saída de um modelo de linguagem de grande escala (LLM) e seus dados de treinamento sempre foi um pouco um enigma para a TI empresarial. Esta semana, o Allen Institute for AI (Ai2) lançou uma nova iniciativa de código aberto empolgante chamada OLMoTrace, que visa desmistificar essa relação. Ao permitir que os usuários rastreiem as saídas do LLM até seus dados de treinamento originais, o OLMoTrace aborda um dos maiores obstáculos para a adoção de IA empresarial: a falta de transparência nos processos de tomada de decisão de IA.

OLMo, que significa Open Language Model, é o nome da família de LLMs de código aberto do Ai2. Você pode experimentar o OLMoTrace com o mais recente modelo OLMo 2 32B no site Playground do Ai2. Além disso, o código de código aberto está disponível no GitHub, para que qualquer pessoa possa usá-lo livremente.

O que diferencia o OLMoTrace de outros métodos, como aqueles focados em pontuações de confiança ou geração aumentada por recuperação, é que ele fornece uma visão clara de como as saídas do modelo se relacionam com os vastos conjuntos de dados de treinamento que os moldaram. Jiacheng Liu, pesquisador do Ai2, disse à VentureBeat: "Nosso objetivo é ajudar os usuários a entender por que os modelos de linguagem geram as respostas que geram."

Como o OLMoTrace Funciona: Mais do que Apenas Citações

Embora LLMs como Perplexity ou ChatGPT Search possam oferecer citações de fontes, eles operam de maneira diferente do OLMoTrace. Segundo Liu, esses modelos usam geração aumentada por recuperação (RAG), que visa melhorar a qualidade da saída do modelo incorporando fontes adicionais além dos dados de treinamento. Por outro lado, o OLMoTrace rastreia a saída do modelo diretamente até o corpus de treinamento sem depender de RAG ou documentos externos.

A ferramenta identifica sequências de texto únicas nas saídas do modelo e as corresponde a documentos específicos dos dados de treinamento. Quando uma correspondência é encontrada, o OLMoTrace não apenas destaca o texto relevante, mas também fornece links para o material de origem original. Isso permite que os usuários vejam exatamente onde e como o modelo aprendeu as informações que utiliza.

Além das Pontuações de Confiança: Evidências Concretas da Tomada de Decisão de IA

Os LLMs geralmente geram saídas com base nos pesos do modelo, que são usados para calcular uma pontuação de confiança. Quanto maior a pontuação, supostamente mais precisa é a saída. No entanto, Liu acredita que essas pontuações podem ser enganosas. "Os modelos podem ser excessivamente confiantes no que geram, e se você pedir que eles gerem uma pontuação, ela geralmente é inflada", ele explicou. "Isso é o que os acadêmicos chamam de erro de calibração—a confiança que os modelos exibem nem sempre reflete o quão precisas são suas respostas."

Em vez de depender de pontuações potencialmente enganosas, o OLMoTrace oferece evidências diretas das fontes de aprendizado do modelo, permitindo que os usuários façam julgamentos informados. "O que o OLMoTrace faz é mostrar as correspondências entre as saídas do modelo e os documentos de treinamento", disse Liu. "Por meio da interface, você pode ver diretamente onde estão os pontos de correspondência e como as saídas do modelo coincidem com os documentos de treinamento."

Como o OLMoTrace se Compara a Outras Abordagens de Transparência

O Ai2 não é a única organização trabalhando para entender melhor as saídas do LLM. A Anthropic também conduziu pesquisas, mas seu foco tem sido nas operações internas do modelo, em vez de seus dados. Liu destacou a diferença: "Estamos adotando uma abordagem diferente deles. Estamos rastreando diretamente o comportamento do modelo, seus dados de treinamento, em oposição a rastrear coisas nos neurônios do modelo, circuitos internos, esse tipo de coisa."

Essa abordagem torna o OLMoTrace mais prático para aplicações empresariais, pois não exige conhecimento profundo da arquitetura de redes neurais para entender os resultados.

Aplicações de IA Empresarial: Da Conformidade Regulatória ao Depuração de Modelos

Para empresas que implementam IA em setores regulados como saúde, finanças ou serviços jurídicos, o OLMoTrace oferece benefícios significativos sobre sistemas de caixa preta tradicionais. "Acreditamos que o OLMoTrace ajudará usuários empresariais e de negócios a entender melhor o que é usado no treinamento de modelos, para que possam ter mais confiança quando quiserem construir sobre eles", afirmou Liu. "Isso pode ajudar a aumentar a transparência e a confiança entre eles em relação aos seus modelos, e também para os clientes em relação aos comportamentos de seus modelos."

A tecnologia permite várias capacidades-chave para equipes de IA empresarial:

Verificação de fatos das saídas do modelo contra fontes originais
Compreensão das origens de alucinações
Melhoria na depuração de modelos ao identificar padrões problemáticos
Reforço da conformidade regulatória por meio da rastreabilidade de dados
Construção de confiança com stakeholders por meio de maior transparência

A equipe do Ai2 já colocou o OLMoTrace em bom uso. "Já estamos usando para melhorar nossos dados de treinamento", revelou Liu. "Quando construímos o OLMo 2 e começamos nosso treinamento, por meio do OLMoTrace, descobrimos que alguns dos dados de pós-treinamento não eram bons."

O Que Isso Significa para a Adoção de IA Empresarial

Para empresas que buscam estar na vanguarda da adoção de IA, o OLMoTrace marca um avanço significativo rumo a sistemas de IA mais responsáveis. A ferramenta está disponível sob uma licença de código aberto Apache 2.0, o que significa que qualquer organização com acesso aos dados de treinamento de seu modelo pode implementar capacidades de rastreamento semelhantes.

"O OLMoTrace pode funcionar em qualquer modelo, desde que você tenha os dados de treinamento do modelo", observou Liu. "Para modelos totalmente abertos, onde todos têm acesso aos dados de treinamento do modelo, qualquer um pode configurar o OLMoTrace para esse modelo, e para modelos proprietários, talvez alguns provedores não queiram liberar seus dados, eles também podem fazer esse OLMoTrace internamente."

À medida que os quadros de governança de IA global evoluem, ferramentas como o OLMoTrace, que permitem verificação e auditabilidade, provavelmente se tornarão componentes cruciais das pilhas de IA empresarial, especialmente em indústrias reguladas onde a transparência é cada vez mais exigida. Para tomadores de decisão técnicos considerando os prós e contras da adoção de IA, o OLMoTrace oferece uma maneira prática de implementar sistemas de IA mais confiáveis e explicáveis sem comprometer o poder dos modelos de linguagem de grande escala.

Artigo relacionado

Estratégia de IA da Adobe: Vencedores e Perdedores na Corrida Tecnológica No mundo em rápida transformação da inteligência artificial (IA), os investidores estão observando de perto quais empresas prosperarão nesta transformação tecnológica. Este artigo examina a abordagem

OpenAI Compromete-se com Correções Após Respostas Excessivamente Concordantes do ChatGPT A OpenAI planeja revisar seu processo de atualização do modelo de IA para o ChatGPT após uma atualização causar respostas excessivamente bajuladoras, gerando amplo feedback dos usuários.No último fim

OpenAI Revela Modelos Avançados de Raciocínio de IA, o3 e o4-mini OpenAI apresentou o3 e o4-mini na quarta-feira, novos modelos de IA projetados para pausar e analisar perguntas antes de responder.OpenAI destaca o3 como seu modelo de raciocínio mais sofisticado até

Comentários (6)

0/200

Enviar

JackMitchell

28 de Julho de 2025 à54 02:20:54 WEST

This OLMoTrace thing sounds pretty cool! Finally, a way to peek under the hood of LLMs and see what’s driving those outputs. I’m curious how it’ll handle messy real-world data though 🤔. Could be a game-changer for IT folks trying to make sense of AI black boxes.

GregoryAdams

22 de Abril de 2025 à18 20:58:18 WEST

OLMoTrace는 LLM의 내부를 들여다볼 수 있는 멋진 도구입니다. 훈련 데이터가 출력에 어떻게 영향을 미치는지 보는 것이 흥미롭습니다. 다만, 인터페이스가 좀 더 사용자 친화적이면 좋겠어요. 그래도, AI 투명성의 좋은 시작입니다! 👀

DonaldLee

22 de Abril de 2025 à13 11:14:13 WEST

OLMoTrace is a cool tool for peeking under the hood of LLMs. It's fascinating to see how the training data influences the output. The interface could be more user-friendly though. Still, it's a great start for transparency in AI! 👀

PaulTaylor

22 de Abril de 2025 à43 08:01:43 WEST

OLMoTrace es una herramienta genial para echar un vistazo bajo el capó de los LLMs. Es fascinante ver cómo los datos de entrenamiento influyen en la salida. La interfaz podría ser más amigable para el usuario, sin embargo. Aún así, es un gran comienzo para la transparencia en la IA! 👀

MichaelDavis

21 de Abril de 2025 à4 22:38:04 WEST

OLMoTrace é uma ferramenta legal para dar uma olhada no funcionamento interno dos LLMs. É fascinante ver como os dados de treinamento influenciam a saída. A interface poderia ser mais amigável, no entanto. Ainda assim, é um ótimo começo para a transparência em IA! 👀

NicholasClark

21 de Abril de 2025 à50 22:02:50 WEST

OLMoTraceはLLMの内部を覗くための素晴らしいツールです。トレーニングデータが出力にどのように影響するかを見るのは興味深いです。ただ、インターフェースがもう少しユーザーフレンドリーだといいですね。それでも、AIの透明性のための良いスタートです！👀

Principais notícias

Gemini 2.5 Pro agora ilimitado e mais barato que Claude, GPT-4o Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas Dublagem AI: Guia Definitivo para Criação de Voz Realista O OpenAI aprimora o assistente de voz da IA para bate -papos melhores Notebooklm se expande globalmente, adiciona slides e verificação de fatos aprimorada Tweaks to Us Data Centers podem desbloquear 76 GW de nova capacidade de energia Ai computando para consumir poder de múltiplos NYCs até 2026, diz o fundador Clone de Voz por IA: Guia definitivo para dominar a conversão de voz Experimente as palavras cruzadas de E/S da IA: uma reviravolta moderna no jogo clássico de palavras O CEO da NVIDIA esclarece conceitos errôneos sobre o impacto do mercado de Deepseek

Mais

Apresentou