选项
首页
新闻
Ai2发布紧凑型AI模型,超越Google、Meta竞争对手

Ai2发布紧凑型AI模型,超越Google、Meta竞争对手

2025-08-14
22

Ai2发布紧凑型AI模型,超越Google、Meta竞争对手

本周小型AI模型掀起热潮。

周四,非营利AI研究组织Ai2推出Olmo 2 1B,一个10亿参数模型,在多项基准测试中超越Google、Meta和阿里巴巴的同类模型。参数,通常称为权重,是塑造模型性能的内部元素。

Olmo 2 1B在Hugging Face平台上以Apache 2.0许可证免费提供,供AI开发者使用。与大多数模型不同,它可完全重现,Ai2共享了其开发使用的代码和数据集(Olmo-mix-1124、Dolmino-mix-1124)。

虽然小型模型可能不如大型模型强大,但它们无需高端硬件,适合在标准笔记本电脑或消费设备上使用的开发者和爱好者。

近期小型模型发布激增,从微软的Phi 4推理系列到Qwen的2.5 Omni 3B。大多数模型,包括Olmo 2 1B,可在现代笔记本电脑甚至移动设备上顺畅运行。

Ai2表示,Olmo 2 1B在来自公共、AI生成和精选来源的4万亿token上进行训练。一百万token大约等于75万个单词。

在GSM8K等算术推理测试中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它还在TruthfulQA事实准确性基准测试中表现出色。

TechCrunch Sessions: AI展示

在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。

TechCrunch Sessions: AI展示

在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。

加州伯克利 | 6月5日 立即预订

此模型在4万亿高质量数据token上预训练,遵循我们7、13和32B模型的相同标准预训练至高质量退火。我们上传了训练中每1000步的中间检查点。

访问基础模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL

— Ai2 (@allen_ai) 2025年5月1日

Ai2警告,Olmo 2 1B存在风险。如所有AI模型,它可能生成有问题输出,包括有害或敏感内容及不准确信息。Ai2建议不要在商业应用中使用。

相关文章
LLM中有什么? AI2 olmotrace将“追踪”来源 LLM中有什么? AI2 olmotrace将“追踪”来源 了解大型语言模型(LLM)的输出及其培训数据之间的连接一直是企业IT的难题。本周,艾伦AI研究所(AI2)发起了一项令人兴奋的新开源计划,名为Olmotrace,旨在使这个Relati神秘化
人工智能生成的交叉游戏将亚瑟-摩根和约书亚-格雷厄姆团结在游戏多元宇宙中 人工智能生成的交叉游戏将亚瑟-摩根和约书亚-格雷厄姆团结在游戏多元宇宙中 当游戏世界发生碰撞亚瑟-摩根与被烧伤的人想象一个传奇游戏角色超越自身故事的境界--当《荒野大镖客:救赎 2》中的亚瑟-摩根与《辐射:新维加斯》中伤痕累累的先知约书亚-格雷厄姆相遇时,会发生什么?这篇人工智能叙事探讨了他们之间深刻的对话,探讨了赎罪、韧性和我们的决定所带来的持久后果等普遍主题。我们将从新兴的人工智能游戏多元宇宙中分析这一引人入胜的交叉故事。主要亮点由人工智能促成的两个标志性人物之间的
微软在新的人工智能合作中托管 xAI 先进的 Grok 3 模型 微软在新的人工智能合作中托管 xAI 先进的 Grok 3 模型 本月早些时候,我的*记事本*调查新闻报道揭露了微软整合埃隆-马斯克(Elon Musk)的Grok人工智能模型的计划--这一消息现已得到官方证实。今天,在微软年度Build开发者大会上,公司高管透露,Azure AI Foundry将整合马斯克xAI初创公司的Grok-3及其紧凑型同胞兄弟Grok-3 mini。微软不断扩展的人工智能生态系统"微软发言人证实:"这些尖端模型将满足微软客户对我们云服
评论 (1)
0/200
MarkWilson
MarkWilson 2025-08-26 23:01:15

This tiny AI model from Ai2 sounds like a game-changer! Beating Google and Meta? That's wild! 🚀 Curious how it performs in real-world apps.

返回顶部
OR