選項
首頁
消息
Google的Gemma 3僅使用一個GPU實現了DeepSeek準確性的98%

Google的Gemma 3僅使用一個GPU實現了DeepSeek準確性的98%

2025-05-01
59

人工智能的經濟學最近已成為主要重點,尤其是在使用GPU芯片時展示了令人印象深刻的規模經濟的初創企業DeepSeek。但是Google不會被淘汰。週三,這家技術巨頭推出了其最新的開源大型語言模型Gemma 3,Gemma 3幾乎與DeepSeek R1型號的準確性相匹配,但使用了較少的計算能力。

Google使用“ ELO”分數(一種在國際象棋和運動中使用的系統來對競爭對手進行排名。 Gemma 3的得分為1338,比R1的1363差一點,這意味著R1在技術上優於Gemma 3。但是,Google估計,NVIDIA的H100 GPU芯片中的32個將達到R1的得分,而Gemma 3僅使用1 H100 GPU實現了結果。 Google將計算和ELO得分的這種平衡稱為“最佳點”。

在博客文章中,Google將Gemma 3描述為“您可以在單個GPU或TPU上運行的最有能力的模型”,指的是其自己的自定義AI芯片,即“張量處理單元”。該公司聲稱,Gemma 3“為其尺寸提供最先進的性能”,淘汰了Llama-405B,DeepSeek-V3和O3-Mini等模型,以對LMARENA的排行榜進行人體偏好評估。這種性能使在單個GPU或TPU主機上創建引人入勝的用戶體驗變得更加容易。

Google 2025 Gemma 3 Elo比較 Google

Google的模型還超過了Meta的Llama 3 ELO分數,Google估計這將需要16個GPU。值得注意的是,這些用於競爭模型的數字是Google的估計; DeepSeek AI僅使用NVIDIA不太能力的H800 GPU披露了R1。

可以在有關HuggingFace的開發人員博客文章中找到更多深入的信息,Gemma 3存儲庫可用。 Gemma 3專為設備使用而不是數據中心而設計,與R1和其他開源模型相比,參數數量的較少。由於參數計數從10億到270億不等,Gemma 3符合目前的標準非常適中,而R1具有6710億個參數,儘管它只能有選擇地使用370億。

Gemma 3效率的關鍵是一種稱為蒸餾的廣泛使用的AI技術,其中較大模型的訓練有素的模型權重轉移到較小的模型,從而增強了其功能。此外,蒸餾模型採取了三種質量控制措施:從人類反饋中學習(RLHF),從機器反饋(RLMF)學習的增強措施以及從執行反饋(RLEF)學習的增強學習。這些有助於完善模型的輸出,使它們更有幫助並提高其數學和編碼能力。

Google的開發人員博客詳細介紹了這些方法,另一篇文章討論了針對移動設備的最小10億參數模型的優化技術。其中包括量化,更新鍵值緩存佈局,改善可變加載時間以及GPU重量共享。

Google不僅在ELO分數上,而且還與其前身Gemma 2及其封閉源的Gemini模型在LiveCodeBench等各種基准上進行了比較。儘管Gemma 3的準確性通常低於Gemini 1.5和Gemini 2.0,但Google指出,儘管參數較少,但它“與封閉的Gemini模型相比表現出了競爭性能”。

Google 2025 Gemma 3和Gemma 2比較 Google

Gemma 3對Gemma 2的重大升級是其更長的“上下文窗口”,從8,000個令牌擴展到128,000個令牌。這使模型可以處理諸如整個論文或書籍之類的較大文本。 Gemma 3也是多模式,能夠處理文本和圖像輸入,與其前身不同。此外,它支持140多種語言,對Gemma 2的僅英語功能有了極大的改善。

除了這些主要功能外,Gemma 3還有其他一些有趣的方面。大型語言模型的一個問題是記住其培訓數據的一部分,這可能導致隱私漏洞。 Google的研究人員為此對Gemma 3進行了測試,並發現它以比其前輩低的速度記住長篇文本,這表明保護了隱私保護。

對於那些對尼特(Nitty-Gritty)感興趣的人,Gemma 3技術論文對模型的功能和開發提供了徹底的細分。

相關文章
AI驅動的摘要:YouTube視頻摘要完整指南 AI驅動的摘要:YouTube視頻摘要完整指南 在當今快節奏的世界中,快速處理和理解資訊的能力比以往任何時候都更重要。YouTube擁有無數的視頻,是知識的寶庫,但誰有時間從頭到尾觀看每個視頻?本指南將展示如何使用AI工具來摘要YouTube視頻,幫助您節省時間並提高生產力。通過使用AI驅動的摘要工具,您可以迅速掌握視頻的要點,幫助您決定是否值得深入觀看或繼續下一個視頻。讓我們來探索這些AI工具如何改變您的學習方式並保持最新資訊。關鍵要點AI驅
AI革新醫療超聲波於即時評估 AI革新醫療超聲波於即時評估 人工智能正在改變醫療領域,超聲波技術也隨之進步。本文探討AI如何轉變即時超聲波(POCUS)評估,使其更易用、高效且精準。從優化圖像獲取到提升解讀精確度,AI將革新超聲波,為各種環境帶來更好的患者照護。重點AI簡化超聲波圖像獲取,使非專家也能輕鬆拍攝診斷品質圖像。機器學習提升超聲波圖像解讀,幫助更精準地辨識和測量病理。因AI,即時超聲波(POCUS)更易普及,可能提升資源匱乏地區的醫療水平。AI有
機器學習速查表:人工智能快速參考指南 機器學習速查表:人工智能快速參考指南 在技術快速變化的世界中,人工智能與雲計算推動創新,保持更新與準備至關重要。無論是與同事討論策略、製作教育內容,還是準備面試,快速獲取關鍵資訊都能產生重大影響。這正是機器學習速查表的作用所在。它們不是用來走捷徑,而是幫助喚醒記憶、複習基本概念,確保你準備好應對人工智能領域的複雜性。重點速查表是人工智能與數據科學專業人士的重要工具。它們提供快速複習基本概念的方法。如Aqeel Anwar的速查表對面試
評論 (5)
0/200
ArthurLopez
ArthurLopez 2025-05-03 08:00:00

Google's Gemma 3 is pretty impressive, hitting 98% accuracy with just one GPU! 🤯 It's like they're showing off, but in a good way. Makes me wonder if I should switch to Google's tech for my projects. Definitely worth a try, right?

EricJohnson
EricJohnson 2025-05-02 08:00:00

GoogleのGemma 3は一つのGPUで98%の精度を達成するなんてすごいですね!🤯 見せびらかしているようだけど、いい意味で。自分のプロジェクトにGoogleの技術を使うべきか考えさせられます。試してみる価値はありそうですね。

StevenAllen
StevenAllen 2025-05-03 08:00:00

구글의 Gemma 3이 한 개의 GPU로 98% 정확도를 달성하다니 정말 대단해요! 🤯 자랑하는 것 같지만 좋은 의미에서요. 내 프로젝트에 구글의 기술을 사용해야 할지 고민하게 만드네요. 시도해 볼 가치가 있을 것 같아요.

AlbertRodriguez
AlbertRodriguez 2025-05-03 08:00:00

O Gemma 3 do Google é impressionante, atingindo 98% de precisão com apenas uma GPU! 🤯 Parece que estão se exibindo, mas de um jeito bom. Me faz pensar se devo mudar para a tecnologia do Google para meus projetos. Vale a pena tentar, né?

GeorgeSmith
GeorgeSmith 2025-05-02 08:00:00

गूगल का Gemma 3 एक ही GPU के साथ 98% सटीकता प्राप्त करना बहुत प्रभावशाली है! 🤯 ऐसा लगता है कि वे अपनी ताकत दिखा रहे हैं, लेकिन अच्छे तरीके से। मुझे सोचने पर मजबूर करता है कि क्या मुझे अपने प्रोजेक्ट्स के लिए गूगल की टेक्नोलॉजी का उपयोग करना चाहिए। निश्चित रूप से कोशिश करने लायक है, है ना?

回到頂部
OR