谷歌AI躍升內幕:Gemini 2.5 思維更深、表達更智能且編碼更快

谷歌朝著通用AI助手的願景邁進一步
在今年的Google I/O大會上,該公司揭示了其Gemini 2.5系列的重大升級,特別是在多個維度上提升其能力。最新的版本——Gemini 2.5 Flash和2.5 Pro——現在比以往更加聰明和高效。這些進步使谷歌更接近實現其創造通用AI助手的願景,這個助手能夠無縫理解情境、計劃並執行任務。### Gemini 2.5 Pro:將智慧提升到新高度
谷歌稱Gemini 2.5 Pro為目前最先進的模型,擁有前所未有的百萬令牌上下文視窗。這個功能讓AI能夠處理大量的數據並在長時間對話中保持連貫性。在大會上,谷歌DeepMind的首席執行官德米斯·哈薩比斯(Demis Hassabis)對取得的進展表示興奮,他說:「這是我們對Gemini應用程式的最終目標:一個個人化、主動且強大的AI。」Gemini 2.5 Pro的一大亮點是引進了『深度思考』,這是一種實驗性的增強推理模式。深度思考讓AI在提供回應之前分析多種假設,從而提升其決策能力。據哈薩比斯所述,這一發展源自於AlphaGo創建過程中的啟發,在那裡更長的處理時間產生了更好的結果。#### 挑戰性基準測試中的出色表現
深度思考已在具有挑戰性的基準測試中展示了出色的表現。例如,它在2025年美國數學奧林匹克競賽(USAMO)中取得了令人印象深刻的成績,並且在LiveCodeBench上表現優異,這是一個測試高級編碼技能的基準。此外,它在MMMU上的得分為84.0%,這項測試評估了多模態理解和推理能力。儘管取得了這些成就,谷歌仍然保持謹慎。哈薩比斯提到,團隊正在進行徹底的安全性評估,並從專家那裡收集反饋,然後才會更廣泛地推出深度思考。目前,它僅通過API供受信任的測試者使用,以收集反饋。### Gemini 2.5 Flash:日常使用的得力助手
除了Gemini 2.5 Pro,谷歌還推出了增強版的Gemini 2.5 Flash,旨在速度、效率和經濟性方面有所提升。哈薩比斯描述它為該系列的「得力助手」,在推理、多模態、代碼和長上下文的基準測試中表現出色。事實上,它在LMArena排行榜上僅次於Gemini 2.5 Pro。更新後的Flash模型約提高了20至30%的效率,完成任務所需的令牌更少。根據開發者的反饋,谷歌微調了模型,並在Google AI Studio、Vertex AI和Gemini應用程式中提供了預覽版。它將在六月初全面推出生產版本。### 兩款模型的新功能
Gemini 2.5 Pro和Flash都獲得了多項新功能,旨在增強用戶互動。新增了本機音頻輸出功能,以創造更自然的對話體驗,而文本轉語音功能現在支援多種聲音。用戶甚至可以引導語音的語氣和風格,無論是要讓AI聽起來戲劇化還是莊重。其他實驗性聲音功能包括情感對話,這讓AI能夠識別用戶聲音中的情緒並作出相應反應,以及主動音頻,這可以過濾背景噪音。還引進了思維預算,讓開發者在AI回應之前控制其使用的計算資源量。### 向未來邁進
這些更新凸顯了谷歌推動AI技術邊界的承諾。正如Kavukcuoglu和Doshi在其部落格文章中所指出的:「我們正處於歷史上的非凡時刻,AI正在創造一個令人驚嘆的新未來。這是不懈的進步。」隨著這些改進,谷歌無疑正在開闢一條道路,讓AI助手成為我們日常生活不可或缺的伴侶。
相關文章
New open source AI company Deep Cogito releases first models and they’re already topping the charts
Deep Cogito Emerges with Revolutionary AI ModelsIn a groundbreaking move, Deep Cogito, a cutting-edge AI research startup located in San Francisco, has officially unveiled its firs
Microsoft announces over 50 AI tools to build the ‘agentic web’ at Build 2025
Microsoft Unveils Vision for the Open Agentic Web at Build ConferenceThis morning, Microsoft kicked off its annual Build conference with a bold declaration: the dawn of the "open a
Google is launching a Gemini integration in Chrome
Introducing Gemini Integration in Chrome: A New Era of AI-Powered BrowsingAt Google I/O 2025, Google made waves by announcing a groundbreaking addition to its Chrome browser—Gemini
評論 (0)
0/200
谷歌朝著通用AI助手的願景邁進一步
在今年的Google I/O大會上,該公司揭示了其Gemini 2.5系列的重大升級,特別是在多個維度上提升其能力。最新的版本——Gemini 2.5 Flash和2.5 Pro——現在比以往更加聰明和高效。這些進步使谷歌更接近實現其創造通用AI助手的願景,這個助手能夠無縫理解情境、計劃並執行任務。### Gemini 2.5 Pro:將智慧提升到新高度
谷歌稱Gemini 2.5 Pro為目前最先進的模型,擁有前所未有的百萬令牌上下文視窗。這個功能讓AI能夠處理大量的數據並在長時間對話中保持連貫性。在大會上,谷歌DeepMind的首席執行官德米斯·哈薩比斯(Demis Hassabis)對取得的進展表示興奮,他說:「這是我們對Gemini應用程式的最終目標:一個個人化、主動且強大的AI。」Gemini 2.5 Pro的一大亮點是引進了『深度思考』,這是一種實驗性的增強推理模式。深度思考讓AI在提供回應之前分析多種假設,從而提升其決策能力。據哈薩比斯所述,這一發展源自於AlphaGo創建過程中的啟發,在那裡更長的處理時間產生了更好的結果。#### 挑戰性基準測試中的出色表現
深度思考已在具有挑戰性的基準測試中展示了出色的表現。例如,它在2025年美國數學奧林匹克競賽(USAMO)中取得了令人印象深刻的成績,並且在LiveCodeBench上表現優異,這是一個測試高級編碼技能的基準。此外,它在MMMU上的得分為84.0%,這項測試評估了多模態理解和推理能力。儘管取得了這些成就,谷歌仍然保持謹慎。哈薩比斯提到,團隊正在進行徹底的安全性評估,並從專家那裡收集反饋,然後才會更廣泛地推出深度思考。目前,它僅通過API供受信任的測試者使用,以收集反饋。### Gemini 2.5 Flash:日常使用的得力助手
除了Gemini 2.5 Pro,谷歌還推出了增強版的Gemini 2.5 Flash,旨在速度、效率和經濟性方面有所提升。哈薩比斯描述它為該系列的「得力助手」,在推理、多模態、代碼和長上下文的基準測試中表現出色。事實上,它在LMArena排行榜上僅次於Gemini 2.5 Pro。更新後的Flash模型約提高了20至30%的效率,完成任務所需的令牌更少。根據開發者的反饋,谷歌微調了模型,並在Google AI Studio、Vertex AI和Gemini應用程式中提供了預覽版。它將在六月初全面推出生產版本。### 兩款模型的新功能
Gemini 2.5 Pro和Flash都獲得了多項新功能,旨在增強用戶互動。新增了本機音頻輸出功能,以創造更自然的對話體驗,而文本轉語音功能現在支援多種聲音。用戶甚至可以引導語音的語氣和風格,無論是要讓AI聽起來戲劇化還是莊重。其他實驗性聲音功能包括情感對話,這讓AI能夠識別用戶聲音中的情緒並作出相應反應,以及主動音頻,這可以過濾背景噪音。還引進了思維預算,讓開發者在AI回應之前控制其使用的計算資源量。### 向未來邁進
這些更新凸顯了谷歌推動AI技術邊界的承諾。正如Kavukcuoglu和Doshi在其部落格文章中所指出的:「我們正處於歷史上的非凡時刻,AI正在創造一個令人驚嘆的新未來。這是不懈的進步。」隨著這些改進,谷歌無疑正在開闢一條道路,讓AI助手成為我們日常生活不可或缺的伴侶。












