opção
Lar
Notícias
O que há dentro do LLM? Ai2 Olmotrace vai 'rastrear' a fonte

O que há dentro do LLM? Ai2 Olmotrace vai 'rastrear' a fonte

21 de Abril de 2025
256

O que há dentro do LLM? Ai2 Olmotrace vai 'rastrear' a fonte

Compreender a conexão entre a saída de um modelo de linguagem de grande escala (LLM) e seus dados de treinamento sempre foi um pouco um enigma para a TI empresarial. Esta semana, o Allen Institute for AI (Ai2) lançou uma nova iniciativa de código aberto empolgante chamada OLMoTrace, que visa desmistificar essa relação. Ao permitir que os usuários rastreiem as saídas do LLM até seus dados de treinamento originais, o OLMoTrace aborda um dos maiores obstáculos para a adoção de IA empresarial: a falta de transparência nos processos de tomada de decisão de IA.

OLMo, que significa Open Language Model, é o nome da família de LLMs de código aberto do Ai2. Você pode experimentar o OLMoTrace com o mais recente modelo OLMo 2 32B no site Playground do Ai2. Além disso, o código de código aberto está disponível no GitHub, para que qualquer pessoa possa usá-lo livremente.

O que diferencia o OLMoTrace de outros métodos, como aqueles focados em pontuações de confiança ou geração aumentada por recuperação, é que ele fornece uma visão clara de como as saídas do modelo se relacionam com os vastos conjuntos de dados de treinamento que os moldaram. Jiacheng Liu, pesquisador do Ai2, disse à VentureBeat: "Nosso objetivo é ajudar os usuários a entender por que os modelos de linguagem geram as respostas que geram."

Como o OLMoTrace Funciona: Mais do que Apenas Citações

Embora LLMs como Perplexity ou ChatGPT Search possam oferecer citações de fontes, eles operam de maneira diferente do OLMoTrace. Segundo Liu, esses modelos usam geração aumentada por recuperação (RAG), que visa melhorar a qualidade da saída do modelo incorporando fontes adicionais além dos dados de treinamento. Por outro lado, o OLMoTrace rastreia a saída do modelo diretamente até o corpus de treinamento sem depender de RAG ou documentos externos.

A ferramenta identifica sequências de texto únicas nas saídas do modelo e as corresponde a documentos específicos dos dados de treinamento. Quando uma correspondência é encontrada, o OLMoTrace não apenas destaca o texto relevante, mas também fornece links para o material de origem original. Isso permite que os usuários vejam exatamente onde e como o modelo aprendeu as informações que utiliza.

Além das Pontuações de Confiança: Evidências Concretas da Tomada de Decisão de IA

Os LLMs geralmente geram saídas com base nos pesos do modelo, que são usados para calcular uma pontuação de confiança. Quanto maior a pontuação, supostamente mais precisa é a saída. No entanto, Liu acredita que essas pontuações podem ser enganosas. "Os modelos podem ser excessivamente confiantes no que geram, e se você pedir que eles gerem uma pontuação, ela geralmente é inflada", ele explicou. "Isso é o que os acadêmicos chamam de erro de calibração—a confiança que os modelos exibem nem sempre reflete o quão precisas são suas respostas."

Em vez de depender de pontuações potencialmente enganosas, o OLMoTrace oferece evidências diretas das fontes de aprendizado do modelo, permitindo que os usuários façam julgamentos informados. "O que o OLMoTrace faz é mostrar as correspondências entre as saídas do modelo e os documentos de treinamento", disse Liu. "Por meio da interface, você pode ver diretamente onde estão os pontos de correspondência e como as saídas do modelo coincidem com os documentos de treinamento."

Como o OLMoTrace se Compara a Outras Abordagens de Transparência

O Ai2 não é a única organização trabalhando para entender melhor as saídas do LLM. A Anthropic também conduziu pesquisas, mas seu foco tem sido nas operações internas do modelo, em vez de seus dados. Liu destacou a diferença: "Estamos adotando uma abordagem diferente deles. Estamos rastreando diretamente o comportamento do modelo, seus dados de treinamento, em oposição a rastrear coisas nos neurônios do modelo, circuitos internos, esse tipo de coisa."

Essa abordagem torna o OLMoTrace mais prático para aplicações empresariais, pois não exige conhecimento profundo da arquitetura de redes neurais para entender os resultados.

Aplicações de IA Empresarial: Da Conformidade Regulatória ao Depuração de Modelos

Para empresas que implementam IA em setores regulados como saúde, finanças ou serviços jurídicos, o OLMoTrace oferece benefícios significativos sobre sistemas de caixa preta tradicionais. "Acreditamos que o OLMoTrace ajudará usuários empresariais e de negócios a entender melhor o que é usado no treinamento de modelos, para que possam ter mais confiança quando quiserem construir sobre eles", afirmou Liu. "Isso pode ajudar a aumentar a transparência e a confiança entre eles em relação aos seus modelos, e também para os clientes em relação aos comportamentos de seus modelos."

A tecnologia permite várias capacidades-chave para equipes de IA empresarial:

  • Verificação de fatos das saídas do modelo contra fontes originais
  • Compreensão das origens de alucinações
  • Melhoria na depuração de modelos ao identificar padrões problemáticos
  • Reforço da conformidade regulatória por meio da rastreabilidade de dados
  • Construção de confiança com stakeholders por meio de maior transparência

A equipe do Ai2 já colocou o OLMoTrace em bom uso. "Já estamos usando para melhorar nossos dados de treinamento", revelou Liu. "Quando construímos o OLMo 2 e começamos nosso treinamento, por meio do OLMoTrace, descobrimos que alguns dos dados de pós-treinamento não eram bons."

O Que Isso Significa para a Adoção de IA Empresarial

Para empresas que buscam estar na vanguarda da adoção de IA, o OLMoTrace marca um avanço significativo rumo a sistemas de IA mais responsáveis. A ferramenta está disponível sob uma licença de código aberto Apache 2.0, o que significa que qualquer organização com acesso aos dados de treinamento de seu modelo pode implementar capacidades de rastreamento semelhantes.

"O OLMoTrace pode funcionar em qualquer modelo, desde que você tenha os dados de treinamento do modelo", observou Liu. "Para modelos totalmente abertos, onde todos têm acesso aos dados de treinamento do modelo, qualquer um pode configurar o OLMoTrace para esse modelo, e para modelos proprietários, talvez alguns provedores não queiram liberar seus dados, eles também podem fazer esse OLMoTrace internamente."

À medida que os quadros de governança de IA global evoluem, ferramentas como o OLMoTrace, que permitem verificação e auditabilidade, provavelmente se tornarão componentes cruciais das pilhas de IA empresarial, especialmente em indústrias reguladas onde a transparência é cada vez mais exigida. Para tomadores de decisão técnicos considerando os prós e contras da adoção de IA, o OLMoTrace oferece uma maneira prática de implementar sistemas de IA mais confiáveis e explicáveis sem comprometer o poder dos modelos de linguagem de grande escala.

Artigo relacionado
A Kakao Mobility apresenta o plano de ação para a direção autônoma de nível 4 com IA física A Kakao Mobility apresenta o plano de ação para a direção autônoma de nível 4 com IA física A Kakao Mobility planeja desenvolver tecnologias de direção autônoma de nível 4 internamente, como parte de sua estratégia de IA física.Na conferência World IT Show 2026, realizada no COEX, em Seul,
A IA física se aproxima cada vez mais das fábricas, à medida que robôs humanóides passam por testes A IA física se aproxima cada vez mais das fábricas, à medida que robôs humanóides passam por testes A Humanoid, uma empresa britânica de tecnologia, deve implantar robôs humanóides nas fábricas da Schaeffler, fornecedora industrial alemã, segundo a Reuters.De acordo com um porta-voz da Humanoid, o
A OpenAI reforça a segurança do ChatGPT por meio de uma parceria com a Yubico para oferecer maior proteção às contas A OpenAI reforça a segurança do ChatGPT por meio de uma parceria com a Yubico para oferecer maior proteção às contas A OpenAI está tomando medidas significativas para reforçar a segurança das contas.Na quinta-feira, a empresa lançou o Advanced Account Security, um conjunto de proteções opcionais para usuários do Cha
Recomendações de tópicos especiais relacionados
Negócios As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos
As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas
xix.ai
Produtividade Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental
Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas
xix.ai
chatbot Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes
Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas
xix.ai
Educação e Aprendizagem Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina
Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas
xix.ai
chatbot Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real
Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real

Descubra os melhores treinadores de conversação e paquera com IA de 2026 no XIX.AI. Nossa seleção cuidadosamente escolhida e com as melhores avaliações ajuda você a desenvolver carisma social e confiança em tempo real. Explore ferramentas imperdíveis e revolucionárias, com comparações entre versões gratuitas e pagas e rankings atualizados semanalmente. Descubra hoje mesmo o seu diferencial social.

10 ferramentas
xix.ai
código Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique
Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique

Descubra as mais recentes e bem avaliadas ferramentas de IA de 2026 para testes unitários automatizados. Nossa seleção cuidadosa inclui soluções poderosas que podem transformar o seu processo, permitindo gerar casos de teste para Jest, PyTest e JUnit de forma instantânea. Compare opções gratuitas e pagas com testes reais e classificações atualizadas semanalmente no XIX.AI. Desfrute das vantagens da IA e aumente a produtividade do seu desenvolvimento hoje mesmo.

10 ferramentas
xix.ai
Comentários (9)
0/500
StevenWilson
StevenWilson 4 de Junho de 2026 à15 09:00:15 WEST

This is neat, but isn't it just giving researchers a fancy way to play "spot the plagiarism"? 🧐 I'd rather see them focus on making models less prone to hallucination in the first place.

AnthonyClark
AnthonyClark 25 de Outubro de 2025 à32 19:30:32 WEST

Наконец-то появился инструмент, который может отслеживать источники LLM! Это как детективная работа для ИИ 😄 Теперь предприятия смогут лучше понимать, откуда берутся ответы модели. Интересно, насколько точно он определяет первоисточники в обучающих данных?

RalphSanchez
RalphSanchez 12 de Setembro de 2025 à46 13:30:46 WEST

Ai2의 이번 프로젝트 진짜 혁신적인 것 같아요! 🎯 LLM의 동작 원리를 파악할 수 있다면 기업에서 AI를 더 안전하게 활용할 수 있을 거예요. 다만 오픈소스라 하더라도 실제 적용이 얼마나 쉬울지 궁금하네요.

JackMitchell
JackMitchell 28 de Julho de 2025 à54 02:20:54 WEST

This OLMoTrace thing sounds pretty cool! Finally, a way to peek under the hood of LLMs and see what’s driving those outputs. I’m curious how it’ll handle messy real-world data though 🤔. Could be a game-changer for IT folks trying to make sense of AI black boxes.

GregoryAdams
GregoryAdams 22 de Abril de 2025 à18 20:58:18 WEST

OLMoTrace는 LLM의 내부를 들여다볼 수 있는 멋진 도구입니다. 훈련 데이터가 출력에 어떻게 영향을 미치는지 보는 것이 흥미롭습니다. 다만, 인터페이스가 좀 더 사용자 친화적이면 좋겠어요. 그래도, AI 투명성의 좋은 시작입니다! 👀

DonaldLee
DonaldLee 22 de Abril de 2025 à13 11:14:13 WEST

OLMoTrace is a cool tool for peeking under the hood of LLMs. It's fascinating to see how the training data influences the output. The interface could be more user-friendly though. Still, it's a great start for transparency in AI! 👀

OR