Google 推出四種規格的 Gemma4 開源模型，其中 310 億參數版本在全球排名第三

首頁

新聞

2026-04-14

SamuelRamirez

北京時間 4 月 3 日凌晨 4:03，Google 正式推出開源大型語言模型 Gemma4。該模型在「單位參數效率」方面取得突破，為驅動智能代理工作流程的開源模型樹立了新標竿。

該系列包含高效能的 E2B（23 億參數）與 E4B（45 億參數）變體，以及高性能的 260 億參數 MoE 模型與 310 億參數密集型模型。作為基於 Gemini3 技術堆疊打造的最新版本，Gemma4 提供完整的多模態輸入支援（圖像與影片）。 E2B 和 E4B 模型亦原生支援語音輸入，可在邊緣端實現即時語音理解。

在技術架構方面，這些大參數模型透過優化實現了卓越的硬體效率。在 Arena AI 文本排行榜上，31B 密集版在全球開源模型中排名第三，而 26B MoE 版則位居第六。其邏輯推理與函數調用能力足夠強大，足以驅動複雜的自主代理。

針對本地部署，Gemma4 大幅降低了獲取尖端 AI 的門檻。未量化版 31B 模型的權重可在單張 80GB H100 GPU 上運行，而量化版本則相容於消費級 GPU。針對行動裝置與物聯網設備，E2B 和 E4B 模型憑藉創新的 PLE 嵌入技術及對 128K 上下文長度的支援，可在樹莓派（Raspberry Pi）和智慧型手機等平台上實現低延遲的邏輯處理。

此次發布不僅彰顯了 Google 對開源生態系統的深切承諾，更透過 Apache 2.0 授權，為全球開發者打造在地化、高隱私的 AI 應用程式奠定了基礎。

騰訊旗下《小龍夏》表現超乎預期，團隊將伺服器容量擴增10倍，並公開致歉及提供補償騰訊正式推出全場景AI智能助手「WorkBuddy」，憑藉高度整合與低部署門檻，標誌著大型模型應用層競賽進入新階段。該產品在發布當天便立即引起業界關注。用戶流量遠超預期，導致相關的騰雲代碼助手（CodeBuddy）出現登入問題及服務不穩定。騰雲團隊隨後發布致歉聲明，表示技術團隊已緊急將容量擴展十倍，目前服務已全面恢復。受影響用戶獲得 5,000 點代碼點數作為補償。業界觀察家將 WorkBudd

Suno 領投方：刪除貼文無法彌補版權訴訟的漏洞備受矚目的 AI 音樂生成平台 Suno 正面臨一場艱難的版權之爭，而其主要投資人的坦率言論，可能正好提供了對方所期盼的證據。 Menlo Ventures（Suno的核心投資者）合夥人C.C. Gong最近刪除了一則推文，該推文與該公司當前的法律辯護策略直接相悖。在之前的版權訴訟中，Suno 的辯護主要依賴「合理使用」的論點，聲稱 AI 生成的音樂僅僅是一種「工具」，不會直接與受版權保護的原創作

Claude Opus 4.7 正式推出，重視可靠性勝於智能 Anthropic 今年持續保持強勁的開發步調，幾乎每隔一天就會推出新功能。備受期待的 Claude Opus 4.7 剛正式發布，有趣的是，Anthropic 在公告中直言不諱地表示：「這並非我們最強大的模型。」傳聞中更強大的 Claude Mythos Preview 仍處於待命狀態。儘管如此，Opus 4.7 仍引起了相當大的關注，因為它著重解決的是「更可靠」而非「更聰明」的問題。基準測試

相關專題推薦

漫畫創作