Google 推出四種規格的 Gemma4 開源模型,其中 310 億參數版本在全球排名第三
北京時間 4 月 3 日凌晨 4:03,Google 正式推出開源大型語言模型 Gemma4。該模型在「單位參數效率」方面取得突破,為驅動智能代理工作流程的開源模型樹立了新標竿。
該系列包含高效能的 E2B(23 億參數)與 E4B(45 億參數)變體,以及高性能的 260 億參數 MoE 模型與 310 億參數密集型模型。作為基於 Gemini3 技術堆疊打造的最新版本,Gemma4 提供完整的多模態輸入支援(圖像與影片)。 E2B 和 E4B 模型亦原生支援語音輸入,可在邊緣端實現即時語音理解。

在技術架構方面,這些大參數模型透過優化實現了卓越的硬體效率。在 Arena AI 文本排行榜上,31B 密集版在全球開源模型中排名第三,而 26B MoE 版則位居第六。其邏輯推理與函數調用能力足夠強大,足以驅動複雜的自主代理。
針對本地部署,Gemma4 大幅降低了獲取尖端 AI 的門檻。未量化版 31B 模型的權重可在單張 80GB H100 GPU 上運行,而量化版本則相容於消費級 GPU。 針對行動裝置與物聯網設備,E2B 和 E4B 模型憑藉創新的 PLE 嵌入技術及對 128K 上下文長度的支援,可在樹莓派(Raspberry Pi)和智慧型手機等平台上實現低延遲的邏輯處理。
此次發布不僅彰顯了 Google 對開源生態系統的深切承諾,更透過 Apache 2.0 授權,為全球開發者打造在地化、高隱私的 AI 應用程式奠定了基礎。
相關文章
騰訊旗下《小龍夏》表現超乎預期,團隊將伺服器容量擴增10倍,並公開致歉及提供補償
騰訊正式推出全場景AI智能助手「WorkBuddy」,憑藉高度整合與低部署門檻,標誌著大型模型應用層競賽進入新階段。該產品在發布當天便立即引起業界關注。 用戶流量遠超預期,導致相關的騰雲代碼助手(CodeBuddy)出現登入問題及服務不穩定。騰雲團隊隨後發布致歉聲明,表示技術團隊已緊急將容量擴展十倍,目前服務已全面恢復。受影響用戶獲得 5,000 點代碼點數作為補償。業界觀察家將 WorkBudd
Suno 領投方:刪除貼文無法彌補版權訴訟的漏洞
備受矚目的 AI 音樂生成平台 Suno 正面臨一場艱難的版權之爭,而其主要投資人的坦率言論,可能正好提供了對方所期盼的證據。 Menlo Ventures(Suno的核心投資者)合夥人C.C. Gong最近刪除了一則推文,該推文與該公司當前的法律辯護策略直接相悖。在之前的版權訴訟中,Suno 的辯護主要依賴「合理使用」的論點,聲稱 AI 生成的音樂僅僅是一種「工具」,不會直接與受版權保護的原創作
Claude Opus 4.7 正式推出,重視可靠性勝於智能
Anthropic 今年持續保持強勁的開發步調,幾乎每隔一天就會推出新功能。備受期待的 Claude Opus 4.7 剛正式發布,有趣的是,Anthropic 在公告中直言不諱地表示:「這並非我們最強大的模型。」 傳聞中更強大的 Claude Mythos Preview 仍處於待命狀態。儘管如此,Opus 4.7 仍引起了相當大的關注,因為它著重解決的是「更可靠」而非「更聰明」的問題。基準測試
相關專題推薦
評論 (1)
0/500
北京時間 4 月 3 日凌晨 4:03,Google 正式推出開源大型語言模型 Gemma4。該模型在「單位參數效率」方面取得突破,為驅動智能代理工作流程的開源模型樹立了新標竿。
該系列包含高效能的 E2B(23 億參數)與 E4B(45 億參數)變體,以及高性能的 260 億參數 MoE 模型與 310 億參數密集型模型。作為基於 Gemini3 技術堆疊打造的最新版本,Gemma4 提供完整的多模態輸入支援(圖像與影片)。 E2B 和 E4B 模型亦原生支援語音輸入,可在邊緣端實現即時語音理解。

在技術架構方面,這些大參數模型透過優化實現了卓越的硬體效率。在 Arena AI 文本排行榜上,31B 密集版在全球開源模型中排名第三,而 26B MoE 版則位居第六。其邏輯推理與函數調用能力足夠強大,足以驅動複雜的自主代理。
針對本地部署,Gemma4 大幅降低了獲取尖端 AI 的門檻。未量化版 31B 模型的權重可在單張 80GB H100 GPU 上運行,而量化版本則相容於消費級 GPU。 針對行動裝置與物聯網設備,E2B 和 E4B 模型憑藉創新的 PLE 嵌入技術及對 128K 上下文長度的支援,可在樹莓派(Raspberry Pi)和智慧型手機等平台上實現低延遲的邏輯處理。
此次發布不僅彰顯了 Google 對開源生態系統的深切承諾,更透過 Apache 2.0 授權,為全球開發者打造在地化、高隱私的 AI 應用程式奠定了基礎。
騰訊旗下《小龍夏》表現超乎預期,團隊將伺服器容量擴增10倍,並公開致歉及提供補償
騰訊正式推出全場景AI智能助手「WorkBuddy」,憑藉高度整合與低部署門檻,標誌著大型模型應用層競賽進入新階段。該產品在發布當天便立即引起業界關注。 用戶流量遠超預期,導致相關的騰雲代碼助手(CodeBuddy)出現登入問題及服務不穩定。騰雲團隊隨後發布致歉聲明,表示技術團隊已緊急將容量擴展十倍,目前服務已全面恢復。受影響用戶獲得 5,000 點代碼點數作為補償。業界觀察家將 WorkBudd
Suno 領投方:刪除貼文無法彌補版權訴訟的漏洞
備受矚目的 AI 音樂生成平台 Suno 正面臨一場艱難的版權之爭,而其主要投資人的坦率言論,可能正好提供了對方所期盼的證據。 Menlo Ventures(Suno的核心投資者)合夥人C.C. Gong最近刪除了一則推文,該推文與該公司當前的法律辯護策略直接相悖。在之前的版權訴訟中,Suno 的辯護主要依賴「合理使用」的論點,聲稱 AI 生成的音樂僅僅是一種「工具」,不會直接與受版權保護的原創作
Claude Opus 4.7 正式推出,重視可靠性勝於智能
Anthropic 今年持續保持強勁的開發步調,幾乎每隔一天就會推出新功能。備受期待的 Claude Opus 4.7 剛正式發布,有趣的是,Anthropic 在公告中直言不諱地表示:「這並非我們最強大的模型。」 傳聞中更強大的 Claude Mythos Preview 仍處於待命狀態。儘管如此,Opus 4.7 仍引起了相當大的關注,因為它著重解決的是「更可靠」而非「更聰明」的問題。基準測試





首頁






