選項
首頁
新聞
Google的Gemma 3僅使用一個GPU實現了DeepSeek準確性的98%

Google的Gemma 3僅使用一個GPU實現了DeepSeek準確性的98%

2025-05-01
134

人工智慧經濟最近成為焦點,特別是新創公司DeepSeek AI展示GPU晶片的大規模經濟效益。但Google不甘示弱。週三,這家科技巨頭推出最新開源大型語言模型Gemma 3,準確度幾乎與DeepSeek的R1模型匹敵,但使用的運算能力顯著較少。

Google使用"Elo"分數衡量性能,這是國際象棋和運動中常用的排名系統。Gemma 3得分1338,略低於R1的1363,意味R1技術上優於Gemma 3。然而,Google估計達到R1分數需32個Nvidia H100 GPU晶片,而Gemma 3僅需一個H100 GPU。Google稱這種運算與Elo分數的平衡為"最佳點"。

在部落格文章中,Google形容Gemma 3為"單一GPU或TPU上能運行的最強模型",指的是其自家AI晶片"張量處理單元"。公司宣稱Gemma 3"以其規模提供頂尖性能",在LMArena排行榜的人類偏好評估中超越Llama-405B、DeepSeek-V3和o3-mini等模型。此性能使在單一GPU或TPU主機上創造引人入勝的用戶體驗更為容易。

Google 2025 Gemma 3 Elo比較 Google

Google的模型在Elo分數上也超越Meta的Llama 3,Google估計後者需16個GPU。值得注意的是,這些競爭模型的數據是Google的估計;DeepSeek AI僅透露R1使用1,814個效能較低的Nvidia H800 GPU。

更多深入資訊可在HuggingFace的開發者部落格文章中找到,Gemma 3儲存庫亦在那裡提供。Gemma 3設計用於設備端而非數據中心,與R1及其他開源模型相比,參數量顯著較少。Gemma 3的參數從10億到270億,相對現今標準頗為適中,而R1擁有6710億參數,雖可選擇性使用370億。

Gemma 3效率的關鍵是廣泛使用的AI技術"蒸餾",將較大模型的訓練權重轉移到較小模型,提升其能力。此外,蒸餾模型經過三項品質控制措施:人類反饋強化學習(RLHF)、機器反饋強化學習(RLMF)和執行反饋強化學習(RLEF)。這些有助於優化模型輸出,使其更實用並提升數學與程式設計能力。

Google的開發者部落格詳細介紹這些方法,另一篇文章討論針對最小10億參數模型的優化技術,適用於行動裝置,包括量化、更新鍵值快取佈局、改善變數載入時間和GPU權重共享。

Google不僅以Elo分數比較Gemma 3,還與其前身Gemma 2及閉源Gemini模型在LiveCodeBench等基準上進行比較。雖然Gemma 3在準確度上通常不如Gemini 1.5和Gemini 2.0,Google指出其"與閉源Gemini模型相比具競爭力",儘管參數較少。

Google 2025 Gemma 3與Gemma 2比較 Google

Gemma 3相較Gemma 2的重大升級是其更長的"上下文視窗",從8,000擴展到128,000個令牌,使模型能處理整篇論文或書籍等大型文本。Gemma 3還具備多模態功能,可處理文本與圖像輸入,不同於其前身。此外,它支援超過140種語言,相較Gemma 2僅限英語的能力有顯著提升。

除了這些主要功能,Gemma 3還有其他有趣面向。大型語言模型的一個問題是可能記憶訓練數據部分,可能導致隱私洩露。Google的研究人員測試Gemma 3,發現其記憶長篇文本的比率低於前身,顯示隱私保護有所改善。

對技術細節有興趣者,Gemma 3技術論文提供了模型能力和開發的詳細分解。

相關文章
創建AI驅動的著色書:全面指南 創建AI驅動的著色書:全面指南 設計著色書是一項有益的追求,結合藝術表達與為使用者提供平靜的體驗。然而,此過程可能相當勞力密集。幸運的是,AI工具能輕鬆簡化高品質、一致的著色頁創建。本指南提供使用AI製作著色書的逐步方法,專注於保持一致風格和最佳效率的技術。關鍵要點使用AI提示工具開發詳細、結構化的著色頁提示。確保著色書中所有頁面的藝術風格一致。生成單一著色頁設計的多樣變化。利用Ideogram等AI平台快速高效創建著色書。精煉
Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo,一家專注於程式碼品質的以色列AI編碼新創公司,與Google Cloud合作推出夥伴關係,以提升AI生成軟體的完整性。隨著企業越來越依賴AI進行編碼,對強大監督和品質保證工具的需求日益增長。Qodo執行長Itamar Friedman指出,AI生成程式碼現已成為現代開發的核心。「想像一個未來,AI撰寫所有程式碼;人類無法全部審查,」Friedman說。「我們需要系統確保程式碼符合預期價值
DeepMind的AI在2025年數學奧林匹克奪金 DeepMind的AI在2025年數學奧林匹克奪金 DeepMind的AI在數學推理上實現驚人突破,在2025年國際數學奧林匹克(IMO)奪得金牌,僅一年後即從2024年的銀牌躍升。此突破凸顯AI在解決需要人類創意的複雜抽象問題上的成長實力。本文探討DeepMind的轉型歷程、關鍵技術進展及此里程碑的廣泛影響。國際數學奧林匹克的重要性自1959年起,國際數學奧林匹克一直是全球頂尖的高中生數學競賽。它以代數、幾何、數論及組合數學的六道複雜題目挑戰參賽
評論 (10)
0/200
RonaldMartinez
RonaldMartinez 2025-08-17 17:00:59

Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's some serious efficiency. Curious how this'll shake up the AI startup scene. 🚀

GaryJones
GaryJones 2025-08-16 01:00:59

Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's some serious efficiency. Curious how this stacks up in real-world apps! 😎

JonathanDavis
JonathanDavis 2025-08-13 21:00:59

Google's Gemma 3 sounds like a game-changer! Achieving 98% of DeepSeek's accuracy with just one GPU is wild. Makes me wonder how this’ll shake up the AI race—more power to the little guys? 🤔

ArthurSanchez
ArthurSanchez 2025-08-05 09:00:59

Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's like getting a sports car for the price of a bike! 😎 Can't wait to see how this shakes up the AI race.

EvelynHarris
EvelynHarris 2025-08-01 14:08:50

Google's Gemma 3 sounds like a game-changer! 98% of DeepSeek's accuracy with just one GPU? That's some serious efficiency. Can't wait to see how devs play with this open-source gem! 😎

ArthurLopez
ArthurLopez 2025-05-03 10:53:19

Google's Gemma 3 is pretty impressive, hitting 98% accuracy with just one GPU! 🤯 It's like they're showing off, but in a good way. Makes me wonder if I should switch to Google's tech for my projects. Definitely worth a try, right?

回到頂部
OR