Ai2推出超越Google、Meta競爭對手的緊湊AI模型

本週小型AI模型掀起熱潮。
週四,非營利AI研究團體Ai2推出Olmo 2 1B,一款10億參數的模型,在多項基準測試中超越Google、Meta和阿里巴巴的同等規模模型。參數,通常稱為權重,是影響模型性能的內部元素。
Olmo 2 1B在Hugging Face平台上以Apache 2.0許可免費提供,該平台為AI開發者服務。與大多數模型不同,它可完全重現,Ai2分享了其開發使用的代碼和數據集(Olmo-mix-1124、Dolmino-mix-1124)。
雖然小型模型可能不如大型模型強大,但它們無需高端硬件,適合使用標準筆記本電腦或消費設備的開發者和愛好者。
近期小型模型發布激增,從Microsoft的Phi 4推理系列到Qwen的2.5 Omni 3B。大多數模型,包括Olmo 2 1B,均可在現代筆記本電腦甚至移動設備上順暢運行。
Ai2表示,Olmo 2 1B在來自公開、AI生成和精選來源的4萬億標記上進行訓練。一百萬標記大約等於75萬字。
在GSM8K等算術推理測試中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它在TruthfulQA基準測試中也表現出色,該基準測試用於評估事實準確性。
TechCrunch Sessions: AI展示
在TC Sessions: AI預訂您的位置,向超過1200名決策者展示您的作品,無需花費過多。截止至5月9日或名額滿額為止。
TechCrunch Sessions: AI展示
在TC Sessions: AI預訂您的位置,向超過1200名決策者展示您的作品,無需花費過多。截止至5月9日或名額滿額為止。
Berkeley, CA | 6月5日
立即預訂
此模型在4萬億高質量數據標記上進行預訓練,遵循與我們7、13和32億模型相同的標準預訓練和高質量退火。我們上傳訓練中每1000步的中間檢查點。
訪問基礎模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
— Ai2 (@allen_ai) 2025年5月1日
Ai2提醒,Olmo 2 1B存在風險。如所有AI模型一樣,它可能生成問題內容,包括有害或敏感內容以及不準確信息。Ai2建議不要在商業應用中使用。
相關文章
LLM中有什麼? AI2 olmotrace將“追踪”來源
了解大型語言模型(LLM)的輸出及其培訓數據之間的連接一直是企業IT的難題。本週,艾倫AI研究所(AI2)發起了一項令人興奮的新開源計劃,名為Olmotrace,旨在使這個Relati神秘化
川普的崛起:政治專家如何誤判他的總統之路
在政治領域,預測往往失準。專家、分析師與評論家頻繁預測選舉結果與政治趨勢,但歷史顯示他們的錯誤,特別是在唐納德·J·川普登上總統寶座的過程中。本文探討那些認為川普總統之路不可能的專家們所犯的顯著錯誤,回顧他們大膽的斷言、背後的背景,以及當不可能成為現實時的教訓。關鍵要點許多專家與名人斷言唐納德·川普永遠無法成為美國總統。這些斷言源於川普非傳統的行事方式、挑釁性言論以及缺乏政治背景。川普違背這些預測
科技巨頭對歐盟AI規範意見分歧,合規期限即將到來
歐盟的AI通用規範實務守則揭示了主要科技公司間的顯著分歧。微軟表示有意採納歐盟的志願性AI合規框架,而Meta則堅決拒絕,稱該指南為過度監管,可能阻礙創新。微軟總裁布拉德·史密斯週五對《路透社》表示:「我們在審查文件後很可能會簽署。」史密斯強調公司的合作立場,指出:「我們致力於支持這項倡議,同時感謝AI辦公室與業界的直接接觸。」相比之下,Meta全球事務負責人喬爾·卡普蘭在LinkedIn上表示:
評論 (0)
0/200
本週小型AI模型掀起熱潮。
週四,非營利AI研究團體Ai2推出Olmo 2 1B,一款10億參數的模型,在多項基準測試中超越Google、Meta和阿里巴巴的同等規模模型。參數,通常稱為權重,是影響模型性能的內部元素。
Olmo 2 1B在Hugging Face平台上以Apache 2.0許可免費提供,該平台為AI開發者服務。與大多數模型不同,它可完全重現,Ai2分享了其開發使用的代碼和數據集(Olmo-mix-1124、Dolmino-mix-1124)。
雖然小型模型可能不如大型模型強大,但它們無需高端硬件,適合使用標準筆記本電腦或消費設備的開發者和愛好者。
近期小型模型發布激增,從Microsoft的Phi 4推理系列到Qwen的2.5 Omni 3B。大多數模型,包括Olmo 2 1B,均可在現代筆記本電腦甚至移動設備上順暢運行。
Ai2表示,Olmo 2 1B在來自公開、AI生成和精選來源的4萬億標記上進行訓練。一百萬標記大約等於75萬字。
在GSM8K等算術推理測試中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它在TruthfulQA基準測試中也表現出色,該基準測試用於評估事實準確性。
TechCrunch Sessions: AI展示
在TC Sessions: AI預訂您的位置,向超過1200名決策者展示您的作品,無需花費過多。截止至5月9日或名額滿額為止。
TechCrunch Sessions: AI展示
在TC Sessions: AI預訂您的位置,向超過1200名決策者展示您的作品,無需花費過多。截止至5月9日或名額滿額為止。
Berkeley, CA | 6月5日 立即預訂此模型在4萬億高質量數據標記上進行預訓練,遵循與我們7、13和32億模型相同的標準預訓練和高質量退火。我們上傳訓練中每1000步的中間檢查點。
— Ai2 (@allen_ai) 2025年5月1日
訪問基礎模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
Ai2提醒,Olmo 2 1B存在風險。如所有AI模型一樣,它可能生成問題內容,包括有害或敏感內容以及不準確信息。Ai2建議不要在商業應用中使用。


0/200
頭號新聞
Gemini 2.5 Pro現在比Claude,GPT-4O更便宜,更便宜
2025頂級AI影片生成器:Pika Labs與其他對比
AI配音:真實聲音創作終極指南
Openai增強了AI語音助手以進行更好的聊天
NotebookLM在全球範圍內擴展,添加幻燈片並增強了事實檢查
對美國數據中心的調整可以解鎖76 GW的新電源容量
創始人說
AI語音克隆:掌握語音轉換的終極指南
體驗AI驅動的I/O填字遊戲:經典文字遊戲中的現代轉折
NVIDIA首席執行官闡明了對DeepSeek市場影響的誤解
更多
精選
更多

Claude
認識Claude:您的AI助手智能工作是否希望您有一個知識淵博的同事,他隨時準備

Cici AI
你是否曾經好奇過Cici AI到底是什麼?讓我告訴你,它不僅僅是一個普通的AI聊

Gemini
有沒有想過關於雙子座的嗡嗡聲是什麼?讓我為您分解。雙子座是由Google Dee

DeepSeek
曾經想過什麼是全部意見?讓我為您分解。 DeepSeek不僅是另一個AI平台;無

Grok
聽說過Grok嗎?這是Xai的Nifty AI助手,這一切都是為了給您直接的勺子

ChatGPT
有沒有想過什麼是什麼?好吧,讓我為您分解它 - 聊天不僅僅是您在技術領域的普通喬

OpenAI
有沒有想過Openai周圍的嗡嗡聲是什麼?好吧,讓我為您分解。 Openai不僅

Tencent Hunyuan
騰訊hunyuan-large,是嗎?就像騰訊技術巨頭開發的AI模型的瑞士軍刀一

Qwen AI
有沒有想過Qwen AI是什麼?好吧,讓我向您介紹阿里巴巴雲的這顆寶石。 Qwe

Runway
有沒有想過如何將您的常規視頻剪輯變成非凡的東西?好吧,讓我向您介紹跑道,這是一個