选项
首页
新闻
Ai2发布紧凑型AI模型,超越Google、Meta竞争对手

Ai2发布紧凑型AI模型,超越Google、Meta竞争对手

2025-08-14
1

Ai2发布紧凑型AI模型,超越Google、Meta竞争对手

本周小型AI模型掀起热潮。

周四,非营利AI研究组织Ai2推出Olmo 2 1B,一个10亿参数模型,在多项基准测试中超越Google、Meta和阿里巴巴的同类模型。参数,通常称为权重,是塑造模型性能的内部元素。

Olmo 2 1B在Hugging Face平台上以Apache 2.0许可证免费提供,供AI开发者使用。与大多数模型不同,它可完全重现,Ai2共享了其开发使用的代码和数据集(Olmo-mix-1124、Dolmino-mix-1124)。

虽然小型模型可能不如大型模型强大,但它们无需高端硬件,适合在标准笔记本电脑或消费设备上使用的开发者和爱好者。

近期小型模型发布激增,从微软的Phi 4推理系列到Qwen的2.5 Omni 3B。大多数模型,包括Olmo 2 1B,可在现代笔记本电脑甚至移动设备上顺畅运行。

Ai2表示,Olmo 2 1B在来自公共、AI生成和精选来源的4万亿token上进行训练。一百万token大约等于75万个单词。

在GSM8K等算术推理测试中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它还在TruthfulQA事实准确性基准测试中表现出色。

TechCrunch Sessions: AI展示

在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。

TechCrunch Sessions: AI展示

在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。

加州伯克利 | 6月5日 立即预订

此模型在4万亿高质量数据token上预训练,遵循我们7、13和32B模型的相同标准预训练至高质量退火。我们上传了训练中每1000步的中间检查点。

访问基础模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL

— Ai2 (@allen_ai) 2025年5月1日

Ai2警告,Olmo 2 1B存在风险。如所有AI模型,它可能生成有问题输出,包括有害或敏感内容及不准确信息。Ai2建议不要在商业应用中使用。

相关文章
LLM中有什么? AI2 olmotrace将“追踪”来源 LLM中有什么? AI2 olmotrace将“追踪”来源 了解大型语言模型(LLM)的输出及其培训数据之间的连接一直是企业IT的难题。本周,艾伦AI研究所(AI2)发起了一项令人兴奋的新开源计划,名为Olmotrace,旨在使这个Relati神秘化
AI在2026年解锁新发现,OpenAI首席执行官称 AI在2026年解锁新发现,OpenAI首席执行官称 在周二发表的题为“温和的奇点”的文章中,OpenAI首席执行官Sam Altman概述了AI在未来15年对人类的变革性影响。Altman的文章对人工通用智能(AGI)持乐观态度,同时对其到来保持审慎看法。他以撰写前瞻性文章闻名,设想AGI将重塑工作、能源和社会结构。他的文章常为OpenAI的即将推出的项目提供一瞥。在文章中,Altman预测,到2026年,AI系统可能带来新颖见解。虽然未具体说明,
特朗普的崛起:政治专家如何误判他的总统之路 特朗普的崛起:政治专家如何误判他的总统之路 在政治领域,预测常常出错。专家、分析师和评论家经常预测选举结果和政治趋势,但历史显示他们的错误,尤其是在唐纳德·J·特朗普登上总统宝座的过程中。本文探讨了那些认为特朗普当选总统不可能的人的显著失误,回顾他们的大胆断言、背后的背景以及当不可能变为现实时的经验教训。关键要点许多专家和名人断言唐纳德·特朗普永远不可能成为美国总统。这些断言源于特朗普非传统的竞选方式、挑衅性言论和缺乏政治背景。特朗普违背了
评论 (0)
0/200
返回顶部
OR