Ai2发布紧凑型AI模型,超越Google、Meta竞争对手

本周小型AI模型掀起热潮。
周四,非营利AI研究组织Ai2推出Olmo 2 1B,一个10亿参数模型,在多项基准测试中超越Google、Meta和阿里巴巴的同类模型。参数,通常称为权重,是塑造模型性能的内部元素。
Olmo 2 1B在Hugging Face平台上以Apache 2.0许可证免费提供,供AI开发者使用。与大多数模型不同,它可完全重现,Ai2共享了其开发使用的代码和数据集(Olmo-mix-1124、Dolmino-mix-1124)。
虽然小型模型可能不如大型模型强大,但它们无需高端硬件,适合在标准笔记本电脑或消费设备上使用的开发者和爱好者。
近期小型模型发布激增,从微软的Phi 4推理系列到Qwen的2.5 Omni 3B。大多数模型,包括Olmo 2 1B,可在现代笔记本电脑甚至移动设备上顺畅运行。
Ai2表示,Olmo 2 1B在来自公共、AI生成和精选来源的4万亿token上进行训练。一百万token大约等于75万个单词。
在GSM8K等算术推理测试中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它还在TruthfulQA事实准确性基准测试中表现出色。
TechCrunch Sessions: AI展示
在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。
TechCrunch Sessions: AI展示
在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。
加州伯克利 | 6月5日
立即预订
此模型在4万亿高质量数据token上预训练,遵循我们7、13和32B模型的相同标准预训练至高质量退火。我们上传了训练中每1000步的中间检查点。
访问基础模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
— Ai2 (@allen_ai) 2025年5月1日
Ai2警告,Olmo 2 1B存在风险。如所有AI模型,它可能生成有问题输出,包括有害或敏感内容及不准确信息。Ai2建议不要在商业应用中使用。
相关文章
LLM中有什么? AI2 olmotrace将“追踪”来源
了解大型语言模型(LLM)的输出及其培训数据之间的连接一直是企业IT的难题。本周,艾伦AI研究所(AI2)发起了一项令人兴奋的新开源计划,名为Olmotrace,旨在使这个Relati神秘化
AI搜索强制政策引发用户出走潮,DuckDuckGo用户激增
继谷歌在2026年I/O大会上宣布将对其搜索引擎进行全面的人工智能改造后,由于没有简单的“一键禁用”功能来关闭AI功能,许多用户开始寻找更具可控性的替代方案。 以隐私保护为宗旨的搜索平台DuckDuckGo近期流量出现明显转移,已成为对谷歌激进AI推广不满用户的热门避风港。1. 用户用脚投票:安装量激增根据DuckDuckGo分享的数据,随着用户对谷歌AI更新的不满情绪加剧,该平台在5月20日至2
小红书进行组织架构调整:柯南出任总裁,新设AI主营部门Dots及海外业务部门Rednote
4月30日,小红书向全体员工发布内部通告,宣布启动新一轮组织架构调整。此次调整的核心在于将社区、电商和商业化三大业务线与公司的技术系统全面整合。 公司新设了名为“Dots”的AI优先部门,这标志着小红书已正式将AI提升为最高战略优先级,旨在使其从工具性功能转变为核心生产力。在人事任命方面,南(丁玲)被任命为小红书总裁,负责公司核心业务运营,并直接向CEO邢宇汇报。 各业务板块负责人也已明确:智恒将
相关专题推荐
评论 (4)
0/500
Interesting to see a nonprofit like Ai2 pushing the boundaries with Olmo 2 1B! It really makes you wonder if the future of AI innovation lies more with smaller, specialized teams rather than just the tech giants. The efficiency gains here could be huge for real-world applications. 🧠
Olmo 2 1B par Ai2 est vraiment impressionnant! Un modèle d'1 milliard de paramètres qui bat ceux de Google et Meta? Ça montre qu'en IA, la taille n'est pas tout. J'adore voir des recherches orientées sur l'efficacité plutôt que la course aux plus gros modèles. C'est plus accessible et peut-être plus durable à long terme! 👏
Honestly, 1B参数的小模型能超越谷歌和Meta的对手,这太令人惊喜了!🥳 感觉大公司们的优势在被慢慢蚕食,这种非营利性组织的创新对整个生态是件好事,更轻量级的AI或许能让更多开发者参与进来。期待看到更多实际应用!

本周小型AI模型掀起热潮。
周四,非营利AI研究组织Ai2推出Olmo 2 1B,一个10亿参数模型,在多项基准测试中超越Google、Meta和阿里巴巴的同类模型。参数,通常称为权重,是塑造模型性能的内部元素。
Olmo 2 1B在Hugging Face平台上以Apache 2.0许可证免费提供,供AI开发者使用。与大多数模型不同,它可完全重现,Ai2共享了其开发使用的代码和数据集(Olmo-mix-1124、Dolmino-mix-1124)。
虽然小型模型可能不如大型模型强大,但它们无需高端硬件,适合在标准笔记本电脑或消费设备上使用的开发者和爱好者。
近期小型模型发布激增,从微软的Phi 4推理系列到Qwen的2.5 Omni 3B。大多数模型,包括Olmo 2 1B,可在现代笔记本电脑甚至移动设备上顺畅运行。
Ai2表示,Olmo 2 1B在来自公共、AI生成和精选来源的4万亿token上进行训练。一百万token大约等于75万个单词。
在GSM8K等算术推理测试中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它还在TruthfulQA事实准确性基准测试中表现出色。
TechCrunch Sessions: AI展示
在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。
TechCrunch Sessions: AI展示
在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。
加州伯克利 | 6月5日 立即预订此模型在4万亿高质量数据token上预训练,遵循我们7、13和32B模型的相同标准预训练至高质量退火。我们上传了训练中每1000步的中间检查点。
— Ai2 (@allen_ai) 2025年5月1日
访问基础模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
Ai2警告,Olmo 2 1B存在风险。如所有AI模型,它可能生成有问题输出,包括有害或敏感内容及不准确信息。Ai2建议不要在商业应用中使用。
LLM中有什么? AI2 olmotrace将“追踪”来源
了解大型语言模型(LLM)的输出及其培训数据之间的连接一直是企业IT的难题。本周,艾伦AI研究所(AI2)发起了一项令人兴奋的新开源计划,名为Olmotrace,旨在使这个Relati神秘化
AI搜索强制政策引发用户出走潮,DuckDuckGo用户激增
继谷歌在2026年I/O大会上宣布将对其搜索引擎进行全面的人工智能改造后,由于没有简单的“一键禁用”功能来关闭AI功能,许多用户开始寻找更具可控性的替代方案。 以隐私保护为宗旨的搜索平台DuckDuckGo近期流量出现明显转移,已成为对谷歌激进AI推广不满用户的热门避风港。1. 用户用脚投票:安装量激增根据DuckDuckGo分享的数据,随着用户对谷歌AI更新的不满情绪加剧,该平台在5月20日至2
小红书进行组织架构调整:柯南出任总裁,新设AI主营部门Dots及海外业务部门Rednote
4月30日,小红书向全体员工发布内部通告,宣布启动新一轮组织架构调整。此次调整的核心在于将社区、电商和商业化三大业务线与公司的技术系统全面整合。 公司新设了名为“Dots”的AI优先部门,这标志着小红书已正式将AI提升为最高战略优先级,旨在使其从工具性功能转变为核心生产力。在人事任命方面,南(丁玲)被任命为小红书总裁,负责公司核心业务运营,并直接向CEO邢宇汇报。 各业务板块负责人也已明确:智恒将
Interesting to see a nonprofit like Ai2 pushing the boundaries with Olmo 2 1B! It really makes you wonder if the future of AI innovation lies more with smaller, specialized teams rather than just the tech giants. The efficiency gains here could be huge for real-world applications. 🧠
Olmo 2 1B par Ai2 est vraiment impressionnant! Un modèle d'1 milliard de paramètres qui bat ceux de Google et Meta? Ça montre qu'en IA, la taille n'est pas tout. J'adore voir des recherches orientées sur l'efficacité plutôt que la course aux plus gros modèles. C'est plus accessible et peut-être plus durable à long terme! 👏
Honestly, 1B参数的小模型能超越谷歌和Meta的对手,这太令人惊喜了!🥳 感觉大公司们的优势在被慢慢蚕食,这种非营利性组织的创新对整个生态是件好事,更轻量级的AI或许能让更多开发者参与进来。期待看到更多实际应用!





首页






