Ai2推出超越Google、Meta競爭對手的緊湊AI模型

本週小型AI模型掀起熱潮。
週四,非營利AI研究團體Ai2推出Olmo 2 1B,一款10億參數的模型,在多項基準測試中超越Google、Meta和阿里巴巴的同等規模模型。參數,通常稱為權重,是影響模型性能的內部元素。
Olmo 2 1B在Hugging Face平台上以Apache 2.0許可免費提供,該平台為AI開發者服務。與大多數模型不同,它可完全重現,Ai2分享了其開發使用的代碼和數據集(Olmo-mix-1124、Dolmino-mix-1124)。
雖然小型模型可能不如大型模型強大,但它們無需高端硬件,適合使用標準筆記本電腦或消費設備的開發者和愛好者。
近期小型模型發布激增,從Microsoft的Phi 4推理系列到Qwen的2.5 Omni 3B。大多數模型,包括Olmo 2 1B,均可在現代筆記本電腦甚至移動設備上順暢運行。
Ai2表示,Olmo 2 1B在來自公開、AI生成和精選來源的4萬億標記上進行訓練。一百萬標記大約等於75萬字。
在GSM8K等算術推理測試中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它在TruthfulQA基準測試中也表現出色,該基準測試用於評估事實準確性。
TechCrunch Sessions: AI展示
在TC Sessions: AI預訂您的位置,向超過1200名決策者展示您的作品,無需花費過多。截止至5月9日或名額滿額為止。
TechCrunch Sessions: AI展示
在TC Sessions: AI預訂您的位置,向超過1200名決策者展示您的作品,無需花費過多。截止至5月9日或名額滿額為止。
Berkeley, CA | 6月5日
立即預訂
此模型在4萬億高質量數據標記上進行預訓練,遵循與我們7、13和32億模型相同的標準預訓練和高質量退火。我們上傳訓練中每1000步的中間檢查點。
訪問基礎模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
— Ai2 (@allen_ai) 2025年5月1日
Ai2提醒,Olmo 2 1B存在風險。如所有AI模型一樣,它可能生成問題內容,包括有害或敏感內容以及不準確信息。Ai2建議不要在商業應用中使用。
相關文章
LLM中有什麼? AI2 olmotrace將“追踪”來源
了解大型語言模型(LLM)的輸出及其培訓數據之間的連接一直是企業IT的難題。本週,艾倫AI研究所(AI2)發起了一項令人興奮的新開源計劃,名為Olmotrace,旨在使這個Relati神秘化
Trace籌集了300萬美元,用於解決企業採用AI智慧助手時所遇到的各種障礙。
儘管人工智慧代理具有巨大潛力,但它們在企業中仍難以取得實質性進展。一家新興的初創企業認為,根本問題在於缺乏上下文資訊。Trace是一家專注於工作流程協作的初創企業,它作為Y Combinator 2025年夏季培訓專案的一部分誕生,旨在彌補這一空白。該公司能夠梳理複雜的企業環境和業務流程,為人工智慧代理提供所需的上下文資訊,從而幫助它們快速發展。“OpenAI和Anthropic培養出了非常優秀的人工智慧實習生,企業完全可以利用這些資源,”Trace的執行長Tim Cherkasov解釋
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
相關專題推薦
評論 (4)
0/500
Interesting to see a nonprofit like Ai2 pushing the boundaries with Olmo 2 1B! It really makes you wonder if the future of AI innovation lies more with smaller, specialized teams rather than just the tech giants. The efficiency gains here could be huge for real-world applications. 🧠
Olmo 2 1B par Ai2 est vraiment impressionnant! Un modèle d'1 milliard de paramètres qui bat ceux de Google et Meta? Ça montre qu'en IA, la taille n'est pas tout. J'adore voir des recherches orientées sur l'efficacité plutôt que la course aux plus gros modèles. C'est plus accessible et peut-être plus durable à long terme! 👏
Honestly, 1B参数的小模型能超越谷歌和Meta的对手,这太令人惊喜了!🥳 感觉大公司们的优势在被慢慢蚕食,这种非营利性组织的创新对整个生态是件好事,更轻量级的AI或许能让更多开发者参与进来。期待看到更多实际应用!

本週小型AI模型掀起熱潮。
週四,非營利AI研究團體Ai2推出Olmo 2 1B,一款10億參數的模型,在多項基準測試中超越Google、Meta和阿里巴巴的同等規模模型。參數,通常稱為權重,是影響模型性能的內部元素。
Olmo 2 1B在Hugging Face平台上以Apache 2.0許可免費提供,該平台為AI開發者服務。與大多數模型不同,它可完全重現,Ai2分享了其開發使用的代碼和數據集(Olmo-mix-1124、Dolmino-mix-1124)。
雖然小型模型可能不如大型模型強大,但它們無需高端硬件,適合使用標準筆記本電腦或消費設備的開發者和愛好者。
近期小型模型發布激增,從Microsoft的Phi 4推理系列到Qwen的2.5 Omni 3B。大多數模型,包括Olmo 2 1B,均可在現代筆記本電腦甚至移動設備上順暢運行。
Ai2表示,Olmo 2 1B在來自公開、AI生成和精選來源的4萬億標記上進行訓練。一百萬標記大約等於75萬字。
在GSM8K等算術推理測試中,Olmo 2 1B超越Google的Gemma 3 1B、Meta的Llama 3.2 1B和阿里巴巴的Qwen 2.5 1.5B。它在TruthfulQA基準測試中也表現出色,該基準測試用於評估事實準確性。
TechCrunch Sessions: AI展示
在TC Sessions: AI預訂您的位置,向超過1200名決策者展示您的作品,無需花費過多。截止至5月9日或名額滿額為止。
TechCrunch Sessions: AI展示
在TC Sessions: AI預訂您的位置,向超過1200名決策者展示您的作品,無需花費過多。截止至5月9日或名額滿額為止。
Berkeley, CA | 6月5日 立即預訂此模型在4萬億高質量數據標記上進行預訓練,遵循與我們7、13和32億模型相同的標準預訓練和高質量退火。我們上傳訓練中每1000步的中間檢查點。
— Ai2 (@allen_ai) 2025年5月1日
訪問基礎模型:https://t.co/xofyWJmo85 pic.twitter.com/7uSJ6sYMdL
Ai2提醒,Olmo 2 1B存在風險。如所有AI模型一樣,它可能生成問題內容,包括有害或敏感內容以及不準確信息。Ai2建議不要在商業應用中使用。
LLM中有什麼? AI2 olmotrace將“追踪”來源
了解大型語言模型(LLM)的輸出及其培訓數據之間的連接一直是企業IT的難題。本週,艾倫AI研究所(AI2)發起了一項令人興奮的新開源計劃,名為Olmotrace,旨在使這個Relati神秘化
Trace籌集了300萬美元,用於解決企業採用AI智慧助手時所遇到的各種障礙。
儘管人工智慧代理具有巨大潛力,但它們在企業中仍難以取得實質性進展。一家新興的初創企業認為,根本問題在於缺乏上下文資訊。Trace是一家專注於工作流程協作的初創企業,它作為Y Combinator 2025年夏季培訓專案的一部分誕生,旨在彌補這一空白。該公司能夠梳理複雜的企業環境和業務流程,為人工智慧代理提供所需的上下文資訊,從而幫助它們快速發展。“OpenAI和Anthropic培養出了非常優秀的人工智慧實習生,企業完全可以利用這些資源,”Trace的執行長Tim Cherkasov解釋
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Interesting to see a nonprofit like Ai2 pushing the boundaries with Olmo 2 1B! It really makes you wonder if the future of AI innovation lies more with smaller, specialized teams rather than just the tech giants. The efficiency gains here could be huge for real-world applications. 🧠
Olmo 2 1B par Ai2 est vraiment impressionnant! Un modèle d'1 milliard de paramètres qui bat ceux de Google et Meta? Ça montre qu'en IA, la taille n'est pas tout. J'adore voir des recherches orientées sur l'efficacité plutôt que la course aux plus gros modèles. C'est plus accessible et peut-être plus durable à long terme! 👏
Honestly, 1B参数的小模型能超越谷歌和Meta的对手,这太令人惊喜了!🥳 感觉大公司们的优势在被慢慢蚕食,这种非营利性组织的创新对整个生态是件好事,更轻量级的AI或许能让更多开发者参与进来。期待看到更多实际应用!





首頁






