Ai2发布紧凑型AI模型,超越Google、Meta竞争对手

本周小型AI模型掀起热潮。
周四,非营利AI研究组织Ai2推出Olmo 2 1B,一个10亿参数模型,在多项基准测试中超越Google、Meta和阿里巴巴的同类模型。参数,通常称为权重,是塑造模型性能的内部元素。
Olmo 2 1B在Hugging Face平台上以Apache 2.0许可证免费提供,供AI开发者使用。与大多数模型不同,它可完全重现,Ai2共享了其开发使用的代码和数据集(Olmo-mix-1124、Dolmino-mix-1124)。
虽然小型模型可能不如大型模型强大,但它们无需高端硬件,适合在标准笔记本电脑或消费设备上使用的开发者和爱好者。
近期小型模型发布激增,从微软的Phi 4推理系列到Qwen的2.5 Omni 3B。大多数模型,包括Olmo 2 1B,可在现代笔记本电脑甚至移动设备上顺畅运行。
Ai2表示,Olmo 2 1B在来自公共、AI生成和精选来源的4万亿token上进行训练。一百万token大约等于75万个单词。
在GSM8K等算术推理测试中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它还在TruthfulQA事实准确性基准测试中表现出色。
TechCrunch Sessions: AI展示
在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。
TechCrunch Sessions: AI展示
在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。
加州伯克利 | 6月5日
立即预订
此模型在4万亿高质量数据token上预训练,遵循我们7、13和32B模型的相同标准预训练至高质量退火。我们上传了训练中每1000步的中间检查点。
访问基础模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
— Ai2 (@allen_ai) 2025年5月1日
Ai2警告,Olmo 2 1B存在风险。如所有AI模型,它可能生成有问题输出,包括有害或敏感内容及不准确信息。Ai2建议不要在商业应用中使用。
相关文章
LLM中有什么? AI2 olmotrace将“追踪”来源
了解大型语言模型(LLM)的输出及其培训数据之间的连接一直是企业IT的难题。本周,艾伦AI研究所(AI2)发起了一项令人兴奋的新开源计划,名为Olmotrace,旨在使这个Relati神秘化
AI在2026年解锁新发现,OpenAI首席执行官称
在周二发表的题为“温和的奇点”的文章中,OpenAI首席执行官Sam Altman概述了AI在未来15年对人类的变革性影响。Altman的文章对人工通用智能(AGI)持乐观态度,同时对其到来保持审慎看法。他以撰写前瞻性文章闻名,设想AGI将重塑工作、能源和社会结构。他的文章常为OpenAI的即将推出的项目提供一瞥。在文章中,Altman预测,到2026年,AI系统可能带来新颖见解。虽然未具体说明,
特朗普的崛起:政治专家如何误判他的总统之路
在政治领域,预测常常出错。专家、分析师和评论家经常预测选举结果和政治趋势,但历史显示他们的错误,尤其是在唐纳德·J·特朗普登上总统宝座的过程中。本文探讨了那些认为特朗普当选总统不可能的人的显著失误,回顾他们的大胆断言、背后的背景以及当不可能变为现实时的经验教训。关键要点许多专家和名人断言唐纳德·特朗普永远不可能成为美国总统。这些断言源于特朗普非传统的竞选方式、挑衅性言论和缺乏政治背景。特朗普违背了
评论 (0)
0/200
本周小型AI模型掀起热潮。
周四,非营利AI研究组织Ai2推出Olmo 2 1B,一个10亿参数模型,在多项基准测试中超越Google、Meta和阿里巴巴的同类模型。参数,通常称为权重,是塑造模型性能的内部元素。
Olmo 2 1B在Hugging Face平台上以Apache 2.0许可证免费提供,供AI开发者使用。与大多数模型不同,它可完全重现,Ai2共享了其开发使用的代码和数据集(Olmo-mix-1124、Dolmino-mix-1124)。
虽然小型模型可能不如大型模型强大,但它们无需高端硬件,适合在标准笔记本电脑或消费设备上使用的开发者和爱好者。
近期小型模型发布激增,从微软的Phi 4推理系列到Qwen的2.5 Omni 3B。大多数模型,包括Olmo 2 1B,可在现代笔记本电脑甚至移动设备上顺畅运行。
Ai2表示,Olmo 2 1B在来自公共、AI生成和精选来源的4万亿token上进行训练。一百万token大约等于75万个单词。
在GSM8K等算术推理测试中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它还在TruthfulQA事实准确性基准测试中表现出色。
TechCrunch Sessions: AI展示
在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。
TechCrunch Sessions: AI展示
在TC Sessions: AI预订展示空间,向超过1200名决策者展示你的工作,费用亲民。截止至5月9日或名额满为止。
加州伯克利 | 6月5日 立即预订此模型在4万亿高质量数据token上预训练,遵循我们7、13和32B模型的相同标准预训练至高质量退火。我们上传了训练中每1000步的中间检查点。
— Ai2 (@allen_ai) 2025年5月1日
访问基础模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
Ai2警告,Olmo 2 1B存在风险。如所有AI模型,它可能生成有问题输出,包括有害或敏感内容及不准确信息。Ai2建议不要在商业应用中使用。



0/200
头条新闻
Gemini 2.5 Pro现在比Claude,GPT-4O更便宜,更便宜
2025顶级AI视频生成器:Pika Labs与其他对比
AI配音:真实声音创作终极指南
Openai增强了AI语音助手以进行更好的聊天
NotebookLM在全球范围内扩展,添加幻灯片并增强了事实检查
对美国数据中心的调整可以解锁76 GW的新电源容量
创始人说
AI语音克隆:掌握语音转换的终极指南
体验AI驱动的I/O填字游戏:经典文字游戏中的现代转折
NVIDIA首席执行官阐明了对DeepSeek市场影响的误解
更多
精选
更多

Claude
认识Claude:您的AI助手智能工作是否希望您有一个知识渊博的同事,他随时准备

Cici AI
你是否曾经好奇过Cici AI到底是什么?让我告诉你,它不仅仅是一个普通的AI聊

Gemini
有没有想过关于双子座的嗡嗡声是什么?让我为您分解。双子座是由Google Dee

DeepSeek
曾经想过什么是全部意见?让我为您分解。 DeepSeek不仅是另一个AI平台;无

Grok
听说过Grok吗?这是Xai的Nifty AI助手,这一切都是为了给您直接的勺子

ChatGPT
有没有想过什么是什么?好吧,让我为您分解它 - 聊天不仅仅是您在技术领域的普通乔

OpenAI
有没有想过Openai周围的嗡嗡声是什么?好吧,让我为您分解。 Openai不仅

Tencent Hunyuan
腾讯hunyuan-large,是吗?就像腾讯技术巨头开发的AI模型的瑞士军刀一

Qwen AI
有没有想过Qwen AI是什么?好吧,让我向您介绍阿里巴巴云的这颗宝石。 Qwe

Runway
有没有想过如何将您的常规视频剪辑变成非凡的东西?好吧,让我向您介绍跑道,这是一个