谷歌AI躍升內幕:Gemini 2.5 思維更深、表達更智能且編碼更快

谷歌朝著通用AI助手的願景邁進一步
在今年的Google I/O大會上,該公司揭示了其Gemini 2.5系列的重大升級,特別是在多個維度上提升其能力。最新的版本——Gemini 2.5 Flash和2.5 Pro——現在比以往更加聰明和高效。這些進步使谷歌更接近實現其創造通用AI助手的願景,這個助手能夠無縫理解情境、計劃並執行任務。### Gemini 2.5 Pro:將智慧提升到新高度
谷歌稱Gemini 2.5 Pro為目前最先進的模型,擁有前所未有的百萬令牌上下文視窗。這個功能讓AI能夠處理大量的數據並在長時間對話中保持連貫性。在大會上,谷歌DeepMind的首席執行官德米斯·哈薩比斯(Demis Hassabis)對取得的進展表示興奮,他說:「這是我們對Gemini應用程式的最終目標:一個個人化、主動且強大的AI。」Gemini 2.5 Pro的一大亮點是引進了『深度思考』,這是一種實驗性的增強推理模式。深度思考讓AI在提供回應之前分析多種假設,從而提升其決策能力。據哈薩比斯所述,這一發展源自於AlphaGo創建過程中的啟發,在那裡更長的處理時間產生了更好的結果。#### 挑戰性基準測試中的出色表現
深度思考已在具有挑戰性的基準測試中展示了出色的表現。例如,它在2025年美國數學奧林匹克競賽(USAMO)中取得了令人印象深刻的成績,並且在LiveCodeBench上表現優異,這是一個測試高級編碼技能的基準。此外,它在MMMU上的得分為84.0%,這項測試評估了多模態理解和推理能力。儘管取得了這些成就,谷歌仍然保持謹慎。哈薩比斯提到,團隊正在進行徹底的安全性評估,並從專家那裡收集反饋,然後才會更廣泛地推出深度思考。目前,它僅通過API供受信任的測試者使用,以收集反饋。### Gemini 2.5 Flash:日常使用的得力助手
除了Gemini 2.5 Pro,谷歌還推出了增強版的Gemini 2.5 Flash,旨在速度、效率和經濟性方面有所提升。哈薩比斯描述它為該系列的「得力助手」,在推理、多模態、代碼和長上下文的基準測試中表現出色。事實上,它在LMArena排行榜上僅次於Gemini 2.5 Pro。更新後的Flash模型約提高了20至30%的效率,完成任務所需的令牌更少。根據開發者的反饋,谷歌微調了模型,並在Google AI Studio、Vertex AI和Gemini應用程式中提供了預覽版。它將在六月初全面推出生產版本。### 兩款模型的新功能
Gemini 2.5 Pro和Flash都獲得了多項新功能,旨在增強用戶互動。新增了本機音頻輸出功能,以創造更自然的對話體驗,而文本轉語音功能現在支援多種聲音。用戶甚至可以引導語音的語氣和風格,無論是要讓AI聽起來戲劇化還是莊重。其他實驗性聲音功能包括情感對話,這讓AI能夠識別用戶聲音中的情緒並作出相應反應,以及主動音頻,這可以過濾背景噪音。還引進了思維預算,讓開發者在AI回應之前控制其使用的計算資源量。### 向未來邁進
這些更新凸顯了谷歌推動AI技術邊界的承諾。正如Kavukcuoglu和Doshi在其部落格文章中所指出的:「我們正處於歷史上的非凡時刻,AI正在創造一個令人驚嘆的新未來。這是不懈的進步。」隨著這些改進,谷歌無疑正在開闢一條道路,讓AI助手成為我們日常生活不可或缺的伴侶。
相關文章
Gemini聊天機器人增強圖像編輯功能
Google的Gemini聊天機器人應用程式現在允許用戶從手機或電腦編輯AI生成和上傳的圖像,該公司於週三在一篇博客文章中宣布。Gemini的內建圖像編輯功能即日起開始推出,計劃在未來幾週內擴展到大多數國家並支持超過45種語言。這是在Google於三月在AI Studio測試的AI圖像編輯模型之後,該模型因其具爭議性的水印移除功能而受到關注。與ChatGPT最近改進的圖像編輯工具類似,Gemini
Google 揭露 Deep Think 以提升 Gemini AI 性能
Google 正在推進其頂級 Gemini AI 模型。在 2025 年週二的 Google I/O 大會上,該公司推出了 Deep Think,這是其旗艦 Gemini 2.5 Pro 模型的進階推理模式。Deep Think 使模型能在回答前評估多個回應,從而在特定基準測試中提升其表現。“Deep Think 最大化了模型的能力,”Google DeepMind(公司的人工智慧研究部門)的負責
AI驅動的零售實驗在Anthropic慘敗
想像一下,將一家小商店交給人工智慧,委託它處理從定價到客戶互動的一切。會出什麼問題呢?Anthropic最近的一項研究於週五發布,回答了這個問題:幾乎所有事情都出了問題。他們的AI助手Claude在舊金山辦公室經營了一個月的小商店,結果就像是為商學院學生寫下的警示故事,由一個毫無現實經驗的人撰寫——在這次實驗中,確實如此。Anthropic辦公室的「商店」是一個裝滿飲料和零食的小冰箱,搭配一個用於
評論 (0)
0/200
谷歌朝著通用AI助手的願景邁進一步
在今年的Google I/O大會上,該公司揭示了其Gemini 2.5系列的重大升級,特別是在多個維度上提升其能力。最新的版本——Gemini 2.5 Flash和2.5 Pro——現在比以往更加聰明和高效。這些進步使谷歌更接近實現其創造通用AI助手的願景,這個助手能夠無縫理解情境、計劃並執行任務。### Gemini 2.5 Pro:將智慧提升到新高度
谷歌稱Gemini 2.5 Pro為目前最先進的模型,擁有前所未有的百萬令牌上下文視窗。這個功能讓AI能夠處理大量的數據並在長時間對話中保持連貫性。在大會上,谷歌DeepMind的首席執行官德米斯·哈薩比斯(Demis Hassabis)對取得的進展表示興奮,他說:「這是我們對Gemini應用程式的最終目標:一個個人化、主動且強大的AI。」Gemini 2.5 Pro的一大亮點是引進了『深度思考』,這是一種實驗性的增強推理模式。深度思考讓AI在提供回應之前分析多種假設,從而提升其決策能力。據哈薩比斯所述,這一發展源自於AlphaGo創建過程中的啟發,在那裡更長的處理時間產生了更好的結果。#### 挑戰性基準測試中的出色表現
深度思考已在具有挑戰性的基準測試中展示了出色的表現。例如,它在2025年美國數學奧林匹克競賽(USAMO)中取得了令人印象深刻的成績,並且在LiveCodeBench上表現優異,這是一個測試高級編碼技能的基準。此外,它在MMMU上的得分為84.0%,這項測試評估了多模態理解和推理能力。儘管取得了這些成就,谷歌仍然保持謹慎。哈薩比斯提到,團隊正在進行徹底的安全性評估,並從專家那裡收集反饋,然後才會更廣泛地推出深度思考。目前,它僅通過API供受信任的測試者使用,以收集反饋。### Gemini 2.5 Flash:日常使用的得力助手
除了Gemini 2.5 Pro,谷歌還推出了增強版的Gemini 2.5 Flash,旨在速度、效率和經濟性方面有所提升。哈薩比斯描述它為該系列的「得力助手」,在推理、多模態、代碼和長上下文的基準測試中表現出色。事實上,它在LMArena排行榜上僅次於Gemini 2.5 Pro。更新後的Flash模型約提高了20至30%的效率,完成任務所需的令牌更少。根據開發者的反饋,谷歌微調了模型,並在Google AI Studio、Vertex AI和Gemini應用程式中提供了預覽版。它將在六月初全面推出生產版本。### 兩款模型的新功能
Gemini 2.5 Pro和Flash都獲得了多項新功能,旨在增強用戶互動。新增了本機音頻輸出功能,以創造更自然的對話體驗,而文本轉語音功能現在支援多種聲音。用戶甚至可以引導語音的語氣和風格,無論是要讓AI聽起來戲劇化還是莊重。其他實驗性聲音功能包括情感對話,這讓AI能夠識別用戶聲音中的情緒並作出相應反應,以及主動音頻,這可以過濾背景噪音。還引進了思維預算,讓開發者在AI回應之前控制其使用的計算資源量。### 向未來邁進
這些更新凸顯了谷歌推動AI技術邊界的承諾。正如Kavukcuoglu和Doshi在其部落格文章中所指出的:「我們正處於歷史上的非凡時刻,AI正在創造一個令人驚嘆的新未來。這是不懈的進步。」隨著這些改進,谷歌無疑正在開闢一條道路,讓AI助手成為我們日常生活不可或缺的伴侶。












