選項
首頁
新聞
Ai2推出超越Google、Meta競爭對手的緊湊AI模型

Ai2推出超越Google、Meta競爭對手的緊湊AI模型

2025-08-14
1

Ai2推出超越Google、Meta競爭對手的緊湊AI模型

本週小型AI模型掀起熱潮。

週四,非營利AI研究團體Ai2推出Olmo 2 1B,一款10億參數的模型,在多項基準測試中超越Google、Meta和阿里巴巴的同等規模模型。參數,通常稱為權重,是影響模型性能的內部元素。

Olmo 2 1B在Hugging Face平台上以Apache 2.0許可免費提供,該平台為AI開發者服務。與大多數模型不同,它可完全重現,Ai2分享了其開發使用的代碼和數據集(Olmo-mix-1124、Dolmino-mix-1124)。

雖然小型模型可能不如大型模型強大,但它們無需高端硬件,適合使用標準筆記本電腦或消費設備的開發者和愛好者。

近期小型模型發布激增,從Microsoft的Phi 4推理系列到Qwen的2.5 Omni 3B。大多數模型,包括Olmo 2 1B,均可在現代筆記本電腦甚至移動設備上順暢運行。

Ai2表示,Olmo 2 1B在來自公開、AI生成和精選來源的4萬億標記上進行訓練。一百萬標記大約等於75萬字。

在GSM8K等算術推理測試中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它在TruthfulQA基準測試中也表現出色,該基準測試用於評估事實準確性。

TechCrunch Sessions: AI展示

在TC Sessions: AI預訂您的位置,向超過1200名決策者展示您的作品,無需花費過多。截止至5月9日或名額滿額為止。

TechCrunch Sessions: AI展示

在TC Sessions: AI預訂您的位置,向超過1200名決策者展示您的作品,無需花費過多。截止至5月9日或名額滿額為止。

Berkeley, CA | 6月5日 立即預訂

此模型在4萬億高質量數據標記上進行預訓練,遵循與我們7、13和32億模型相同的標準預訓練和高質量退火。我們上傳訓練中每1000步的中間檢查點。

訪問基礎模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL

— Ai2 (@allen_ai) 2025年5月1日

Ai2提醒,Olmo 2 1B存在風險。如所有AI模型一樣,它可能生成問題內容,包括有害或敏感內容以及不準確信息。Ai2建議不要在商業應用中使用。

相關文章
LLM中有什麼? AI2 olmotrace將“追踪”來源 LLM中有什麼? AI2 olmotrace將“追踪”來源 了解大型語言模型(LLM)的輸出及其培訓數據之間的連接一直是企業IT的難題。本週,艾倫AI研究所(AI2)發起了一項令人興奮的新開源計劃,名為Olmotrace,旨在使這個Relati神秘化
川普的崛起:政治專家如何誤判他的總統之路 川普的崛起:政治專家如何誤判他的總統之路 在政治領域,預測往往失準。專家、分析師與評論家頻繁預測選舉結果與政治趨勢,但歷史顯示他們的錯誤,特別是在唐納德·J·川普登上總統寶座的過程中。本文探討那些認為川普總統之路不可能的專家們所犯的顯著錯誤,回顧他們大膽的斷言、背後的背景,以及當不可能成為現實時的教訓。關鍵要點許多專家與名人斷言唐納德·川普永遠無法成為美國總統。這些斷言源於川普非傳統的行事方式、挑釁性言論以及缺乏政治背景。川普違背這些預測
科技巨頭對歐盟AI規範意見分歧,合規期限即將到來 科技巨頭對歐盟AI規範意見分歧,合規期限即將到來 歐盟的AI通用規範實務守則揭示了主要科技公司間的顯著分歧。微軟表示有意採納歐盟的志願性AI合規框架,而Meta則堅決拒絕,稱該指南為過度監管,可能阻礙創新。微軟總裁布拉德·史密斯週五對《路透社》表示:「我們在審查文件後很可能會簽署。」史密斯強調公司的合作立場,指出:「我們致力於支持這項倡議,同時感謝AI辦公室與業界的直接接觸。」相比之下,Meta全球事務負責人喬爾·卡普蘭在LinkedIn上表示:
評論 (0)
0/200
回到頂部
OR