Google啟動高級AI推理模型系列

週二,Google 推出了 Gemini 2.5,這是一組全新的 AI 模型,會在給出答案前「思考」片刻。就像它們在試圖模仿我們人類,對吧?
領銜的是 Gemini 2.5 Pro Experimental,Google 宣稱這是迄今為止他們最聰明的模型。這款強大的模型支援多模態,能輕鬆應對推理任務。你可以從週二開始在 Google AI Studio 上體驗它,或者如果你每月支付 20 美元訂閱 Gemini Advanced,就可透過 Gemini 應用程式使用它。
Google 對推理功能非常認真——他們計劃將其融入未來所有的 AI 模型中。
自從 OpenAI 在 2024 年 9 月推出了首個 AI 推理模型 o1 後,科技界一直在競相追趕。現在,Anthropic、DeepSeek、Google 和 xAI 都紛紛推出自己的推理模型。這些模型需要更多時間和計算能力來驗證事實並思考問題,然後才給出答案。
推理技術對 AI 來說是一大突破,特別是在數學和程式設計領域。許多科技界人士認為,這些推理模型對 AI 代理至關重要——那些無需人類監督就能自主完成任務的系統。不過,沒錯,它們的成本也更高。
Google 對此並不陌生——他們之前已經嘗試過推理模型,比如去年 12 月發布的 Gemini「思考」版本。但 Gemini 2.5?這是他們試圖超越 OpenAI「o」系列的大手筆。
Google 聲稱 Gemini 2.5 Pro 在多項基準測試中超越了他們的舊模型以及競爭對手的頂尖模型。他們針對視覺效果出色的網頁應用程式和可獨立運作的程式設計項目,特別優化了 Gemini 2.5。
在 Aider Polyglot 程式碼編輯測試中,Gemini 2.5 Pro 獲得了 68.6% 的優異成績,擊敗了 OpenAI、Anthropic 和 DeepSeek 的最佳表現。但在 SWE-bench Verified 軟體開發測試中,它達到了 63.8%——足以擊敗 OpenAI 的 o3-mini 和 DeepSeek 的 R1,但未能超越 Anthropic 的 Claude 3.7 Sonnet,後者得分 70.3%。
還有「人類的最後考試」,這是一項涵蓋數學、人文和科學的艱難多模態測試,包含數千道問題。Gemini 2.5 Pro 取得了 18.8% 的成績,優於大多數知名模型。
一推出,Gemini 2.5 Pro 就具備 100 萬 token 的上下文窗口——這就像能一口氣讀完整個《魔戒》系列。很快,他們還計劃將其擴展到 200 萬 token。
Google 目前尚未公開 API 定價,但他們承諾在未來幾週內會透露詳情。
相關文章
Google 揭曉 AI 驅動的簡化工具以提升網頁閱讀體驗
Google 的 iOS 應用程式現已包含「簡化」功能,利用 AI 將複雜的網頁文字轉化為清晰易懂的內容,無需離開頁面。簡化工具由 Google Research 開發,使用 Gemini 重新表述複雜文字,同時保留重要細節。測試顯示它能提升資訊的理解和記憶。透過簡化工具,Google 旨在讓用戶在其生態系統內處理複雜主題,減少對外部工具如 OpenAI 的 ChatGPT 的依賴。要使用簡化工具
Gemini聊天機器人增強圖像編輯功能
Google的Gemini聊天機器人應用程式現在允許用戶從手機或電腦編輯AI生成和上傳的圖像,該公司於週三在一篇博客文章中宣布。Gemini的內建圖像編輯功能即日起開始推出,計劃在未來幾週內擴展到大多數國家並支持超過45種語言。這是在Google於三月在AI Studio測試的AI圖像編輯模型之後,該模型因其具爭議性的水印移除功能而受到關注。與ChatGPT最近改進的圖像編輯工具類似,Gemini
Google 揭露 Deep Think 以提升 Gemini AI 性能
Google 正在推進其頂級 Gemini AI 模型。在 2025 年週二的 Google I/O 大會上,該公司推出了 Deep Think,這是其旗艦 Gemini 2.5 Pro 模型的進階推理模式。Deep Think 使模型能在回答前評估多個回應,從而在特定基準測試中提升其表現。“Deep Think 最大化了模型的能力,”Google DeepMind(公司的人工智慧研究部門)的負責
評論 (35)
0/200
RonaldMartinez
2025-04-24 12:43:27
Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔
0
RalphHill
2025-04-22 22:53:21
O Gemini 2.5 é bem legal, mas às vezes demora muito para 'pensar'. Entendo que está tentando ser mais humano, mas quando preciso de respostas rápidas, é um pouco frustrante. Ainda assim, é mais inteligente que a maioria dos AIs por aí! 🤖💭
0
HenryJackson
2025-04-20 14:08:13
ジェミニ2.5は結構クールだけど、時々「考える」のに時間がかかりすぎる。もっと人間っぽくなるのは分かるけど、早く答えが欲しい時はちょっとイライラする。でも、他のAIより賢いからね!🤖💭
0
JerryGonzález
2025-04-19 20:28:17
ジェミニ2.5、面白いですね!回答前に少し考えるのが人間っぽくて好きです。試してみたら前より賢くなってるのがわかりました。ただ、時々レスポンスが遅いのが気になりますが、深く考えるための代償だと思えば許せますね!🤔
0
ScottJohnson
2025-04-18 04:30:39
Gemini 2.5 thật tuyệt! Nó dừng lại để suy nghĩ trước khi trả lời, rất giống con người. Mình đã thử và thấy nó thông minh hơn phiên bản trước nhiều. Chỉ có điều là đôi khi nó trả lời chậm quá, nhưng mình nghĩ đó là cái giá của việc suy nghĩ sâu sắc, phải không? 🤔
0
MarkScott
2025-04-18 01:52:58
Gemini 2.5 крутой! Он действительно делает паузу, чтобы подумать, прежде чем ответить, что делает его более похожим на человека. Попробовал версию Pro Experimental, и она определенно умнее. Хотелось бы, чтобы он был быстрее! 🤔🚀
0
週二,Google 推出了 Gemini 2.5,這是一組全新的 AI 模型,會在給出答案前「思考」片刻。就像它們在試圖模仿我們人類,對吧?
領銜的是 Gemini 2.5 Pro Experimental,Google 宣稱這是迄今為止他們最聰明的模型。這款強大的模型支援多模態,能輕鬆應對推理任務。你可以從週二開始在 Google AI Studio 上體驗它,或者如果你每月支付 20 美元訂閱 Gemini Advanced,就可透過 Gemini 應用程式使用它。
Google 對推理功能非常認真——他們計劃將其融入未來所有的 AI 模型中。
自從 OpenAI 在 2024 年 9 月推出了首個 AI 推理模型 o1 後,科技界一直在競相追趕。現在,Anthropic、DeepSeek、Google 和 xAI 都紛紛推出自己的推理模型。這些模型需要更多時間和計算能力來驗證事實並思考問題,然後才給出答案。
推理技術對 AI 來說是一大突破,特別是在數學和程式設計領域。許多科技界人士認為,這些推理模型對 AI 代理至關重要——那些無需人類監督就能自主完成任務的系統。不過,沒錯,它們的成本也更高。
Google 對此並不陌生——他們之前已經嘗試過推理模型,比如去年 12 月發布的 Gemini「思考」版本。但 Gemini 2.5?這是他們試圖超越 OpenAI「o」系列的大手筆。
Google 聲稱 Gemini 2.5 Pro 在多項基準測試中超越了他們的舊模型以及競爭對手的頂尖模型。他們針對視覺效果出色的網頁應用程式和可獨立運作的程式設計項目,特別優化了 Gemini 2.5。
在 Aider Polyglot 程式碼編輯測試中,Gemini 2.5 Pro 獲得了 68.6% 的優異成績,擊敗了 OpenAI、Anthropic 和 DeepSeek 的最佳表現。但在 SWE-bench Verified 軟體開發測試中,它達到了 63.8%——足以擊敗 OpenAI 的 o3-mini 和 DeepSeek 的 R1,但未能超越 Anthropic 的 Claude 3.7 Sonnet,後者得分 70.3%。
還有「人類的最後考試」,這是一項涵蓋數學、人文和科學的艱難多模態測試,包含數千道問題。Gemini 2.5 Pro 取得了 18.8% 的成績,優於大多數知名模型。
一推出,Gemini 2.5 Pro 就具備 100 萬 token 的上下文窗口——這就像能一口氣讀完整個《魔戒》系列。很快,他們還計劃將其擴展到 200 萬 token。
Google 目前尚未公開 API 定價,但他們承諾在未來幾週內會透露詳情。




Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔




O Gemini 2.5 é bem legal, mas às vezes demora muito para 'pensar'. Entendo que está tentando ser mais humano, mas quando preciso de respostas rápidas, é um pouco frustrante. Ainda assim, é mais inteligente que a maioria dos AIs por aí! 🤖💭




ジェミニ2.5は結構クールだけど、時々「考える」のに時間がかかりすぎる。もっと人間っぽくなるのは分かるけど、早く答えが欲しい時はちょっとイライラする。でも、他のAIより賢いからね!🤖💭




ジェミニ2.5、面白いですね!回答前に少し考えるのが人間っぽくて好きです。試してみたら前より賢くなってるのがわかりました。ただ、時々レスポンスが遅いのが気になりますが、深く考えるための代償だと思えば許せますね!🤔




Gemini 2.5 thật tuyệt! Nó dừng lại để suy nghĩ trước khi trả lời, rất giống con người. Mình đã thử và thấy nó thông minh hơn phiên bản trước nhiều. Chỉ có điều là đôi khi nó trả lời chậm quá, nhưng mình nghĩ đó là cái giá của việc suy nghĩ sâu sắc, phải không? 🤔




Gemini 2.5 крутой! Он действительно делает паузу, чтобы подумать, прежде чем ответить, что делает его более похожим на человека. Попробовал версию Pro Experimental, и она определенно умнее. Хотелось бы, чтобы он был быстрее! 🤔🚀












