Ai2 Revela Modelo de IA Compacto que Supera Rivais do Google e Meta

Modelos de IA pequenos estão causando impacto esta semana.
Na quinta-feira, a Ai2, um grupo de pesquisa de IA sem fins lucrativos, lançou o Olmo 2 1B, um modelo de 1 bilhão de parâmetros que supera modelos de tamanho semelhante do Google, Meta e Alibaba em vários benchmarks. Parâmetros, frequentemente chamados de pesos, são os elementos internos que moldam o desempenho de um modelo.
O Olmo 2 1B está disponível gratuitamente sob uma licença Apache 2.0 no Hugging Face, uma plataforma para desenvolvedores de IA. Diferentemente da maioria dos modelos, ele pode ser totalmente recriado, com a Ai2 compartilhando o código e os conjuntos de dados (Olmo-mix-1124, Dolmino-mix-1124) usados em seu desenvolvimento.
Embora modelos menores possam não ter a potência dos maiores, eles não exigem hardware de ponta, tornando-os ideais para desenvolvedores e entusiastas usando laptops padrão ou dispositivos de consumo.
Nos últimos dias, houve um aumento no lançamento de modelos pequenos, desde a família de raciocínio Phi 4 da Microsoft até o Qwen 2.5 Omni 3B. A maioria, incluindo o Olmo 2 1B, pode rodar sem problemas em laptops modernos ou até mesmo em dispositivos móveis.
A Ai2 observa que o Olmo 2 1B foi treinado em 4 trilhões de tokens de fontes públicas, geradas por IA e selecionadas. Um milhão de tokens equivale aproximadamente a 750.000 palavras.
Em testes de raciocínio aritmético como o GSM8K, o Olmo 2 1B supera o Gemma 3 1B do Google, o Llama 3.2 1B da Meta e o Qwen 2.5 1.5B da Alibaba. Ele também se destaca no TruthfulQA, um benchmark para precisão factual.
Exibição no TechCrunch Sessions: AI
Garanta seu espaço no TC Sessions: AI para apresentar seu trabalho a mais de 1.200 tomadores de decisão sem gastar muito. Disponível até 9 de maio ou enquanto houver vagas.
Exibição no TechCrunch Sessions: AI
Garanta seu espaço no TC Sessions: AI para apresentar seu trabalho a mais de 1.200 tomadores de decisão sem gastar muito. Disponível até 9 de maio ou enquanto houver vagas.
Berkeley, CA | 5 de junho
RESERVE AGORA
Este modelo foi pré-treinado em 4T tokens de dados de alta qualidade, seguindo o mesmo padrão de pré-treinamento em recozimento de alta qualidade de nossos modelos de 7, 13 e 32B. Carregamos pontos de verificação intermediários a cada 1000 passos no treinamento.
Acesse o modelo base: https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
— Ai2 (@allen_ai) 1 de maio de 2025
A Ai2 alerta que o Olmo 2 1B tem riscos. Como todos os modelos de IA, ele pode gerar saídas problemáticas, incluindo conteúdo prejudicial ou sensível e informações imprecisas. A Ai2 desaconselha seu uso em aplicações comerciais.
Artigo relacionado
O que há dentro do LLM? Ai2 Olmotrace vai 'rastrear' a fonte
Compreender a conexão entre a saída de um grande modelo de linguagem (LLM) e seus dados de treinamento sempre foi um pouco de quebra -cabeça para a empresa. Nesta semana, o Allen Institute for AI (AI2) lançou uma nova iniciativa emocionante de código aberto chamado Olmotrace, que visa desmistificar este relati
Principal investidor da Suno: a exclusão de publicações não resolverá o problema do processo por violação de direitos autorais
A tão esperada plataforma de geração musical por IA, Suno, enfrenta uma dura batalha judicial sobre direitos autorais, e um comentário sincero de seu principal investidor pode ter dado ao lado adversá
Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência
A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire
Recomendações de tópicos especiais relacionados
Comentários (4)
Interesting to see a nonprofit like Ai2 pushing the boundaries with Olmo 2 1B! It really makes you wonder if the future of AI innovation lies more with smaller, specialized teams rather than just the tech giants. The efficiency gains here could be huge for real-world applications. 🧠
Olmo 2 1B par Ai2 est vraiment impressionnant! Un modèle d'1 milliard de paramètres qui bat ceux de Google et Meta? Ça montre qu'en IA, la taille n'est pas tout. J'adore voir des recherches orientées sur l'efficacité plutôt que la course aux plus gros modèles. C'est plus accessible et peut-être plus durable à long terme! 👏
Honestly, 1B参数的小模型能超越谷歌和Meta的对手,这太令人惊喜了!🥳 感觉大公司们的优势在被慢慢蚕食,这种非营利性组织的创新对整个生态是件好事,更轻量级的AI或许能让更多开发者参与进来。期待看到更多实际应用!

Modelos de IA pequenos estão causando impacto esta semana.
Na quinta-feira, a Ai2, um grupo de pesquisa de IA sem fins lucrativos, lançou o Olmo 2 1B, um modelo de 1 bilhão de parâmetros que supera modelos de tamanho semelhante do Google, Meta e Alibaba em vários benchmarks. Parâmetros, frequentemente chamados de pesos, são os elementos internos que moldam o desempenho de um modelo.
O Olmo 2 1B está disponível gratuitamente sob uma licença Apache 2.0 no Hugging Face, uma plataforma para desenvolvedores de IA. Diferentemente da maioria dos modelos, ele pode ser totalmente recriado, com a Ai2 compartilhando o código e os conjuntos de dados (Olmo-mix-1124, Dolmino-mix-1124) usados em seu desenvolvimento.
Embora modelos menores possam não ter a potência dos maiores, eles não exigem hardware de ponta, tornando-os ideais para desenvolvedores e entusiastas usando laptops padrão ou dispositivos de consumo.
Nos últimos dias, houve um aumento no lançamento de modelos pequenos, desde a família de raciocínio Phi 4 da Microsoft até o Qwen 2.5 Omni 3B. A maioria, incluindo o Olmo 2 1B, pode rodar sem problemas em laptops modernos ou até mesmo em dispositivos móveis.
A Ai2 observa que o Olmo 2 1B foi treinado em 4 trilhões de tokens de fontes públicas, geradas por IA e selecionadas. Um milhão de tokens equivale aproximadamente a 750.000 palavras.
Em testes de raciocínio aritmético como o GSM8K, o Olmo 2 1B supera o Gemma 3 1B do Google, o Llama 3.2 1B da Meta e o Qwen 2.5 1.5B da Alibaba. Ele também se destaca no TruthfulQA, um benchmark para precisão factual.
Exibição no TechCrunch Sessions: AI
Garanta seu espaço no TC Sessions: AI para apresentar seu trabalho a mais de 1.200 tomadores de decisão sem gastar muito. Disponível até 9 de maio ou enquanto houver vagas.
Exibição no TechCrunch Sessions: AI
Garanta seu espaço no TC Sessions: AI para apresentar seu trabalho a mais de 1.200 tomadores de decisão sem gastar muito. Disponível até 9 de maio ou enquanto houver vagas.
Berkeley, CA | 5 de junho RESERVE AGORAEste modelo foi pré-treinado em 4T tokens de dados de alta qualidade, seguindo o mesmo padrão de pré-treinamento em recozimento de alta qualidade de nossos modelos de 7, 13 e 32B. Carregamos pontos de verificação intermediários a cada 1000 passos no treinamento.
— Ai2 (@allen_ai) 1 de maio de 2025
Acesse o modelo base: https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
A Ai2 alerta que o Olmo 2 1B tem riscos. Como todos os modelos de IA, ele pode gerar saídas problemáticas, incluindo conteúdo prejudicial ou sensível e informações imprecisas. A Ai2 desaconselha seu uso em aplicações comerciais.
O que há dentro do LLM? Ai2 Olmotrace vai 'rastrear' a fonte
Compreender a conexão entre a saída de um grande modelo de linguagem (LLM) e seus dados de treinamento sempre foi um pouco de quebra -cabeça para a empresa. Nesta semana, o Allen Institute for AI (AI2) lançou uma nova iniciativa emocionante de código aberto chamado Olmotrace, que visa desmistificar este relati
Principal investidor da Suno: a exclusão de publicações não resolverá o problema do processo por violação de direitos autorais
A tão esperada plataforma de geração musical por IA, Suno, enfrenta uma dura batalha judicial sobre direitos autorais, e um comentário sincero de seu principal investidor pode ter dado ao lado adversá
Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência
A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire
Interesting to see a nonprofit like Ai2 pushing the boundaries with Olmo 2 1B! It really makes you wonder if the future of AI innovation lies more with smaller, specialized teams rather than just the tech giants. The efficiency gains here could be huge for real-world applications. 🧠
Olmo 2 1B par Ai2 est vraiment impressionnant! Un modèle d'1 milliard de paramètres qui bat ceux de Google et Meta? Ça montre qu'en IA, la taille n'est pas tout. J'adore voir des recherches orientées sur l'efficacité plutôt que la course aux plus gros modèles. C'est plus accessible et peut-être plus durable à long terme! 👏
Honestly, 1B参数的小模型能超越谷歌和Meta的对手,这太令人惊喜了!🥳 感觉大公司们的优势在被慢慢蚕食,这种非营利性组织的创新对整个生态是件好事,更轻量级的AI或许能让更多开发者参与进来。期待看到更多实际应用!





Lar






