Google啟動高級AI推理模型系列

週二,Google 推出了 Gemini 2.5,這是一組全新的 AI 模型,會在給出答案前「思考」片刻。就像它們在試圖模仿我們人類,對吧?
領銜的是 Gemini 2.5 Pro Experimental,Google 宣稱這是迄今為止他們最聰明的模型。這款強大的模型支援多模態,能輕鬆應對推理任務。你可以從週二開始在 Google AI Studio 上體驗它,或者如果你每月支付 20 美元訂閱 Gemini Advanced,就可透過 Gemini 應用程式使用它。
Google 對推理功能非常認真——他們計劃將其融入未來所有的 AI 模型中。
自從 OpenAI 在 2024 年 9 月推出了首個 AI 推理模型 o1 後,科技界一直在競相追趕。現在,Anthropic、DeepSeek、Google 和 xAI 都紛紛推出自己的推理模型。這些模型需要更多時間和計算能力來驗證事實並思考問題,然後才給出答案。
推理技術對 AI 來說是一大突破,特別是在數學和程式設計領域。許多科技界人士認為,這些推理模型對 AI 代理至關重要——那些無需人類監督就能自主完成任務的系統。不過,沒錯,它們的成本也更高。
Google 對此並不陌生——他們之前已經嘗試過推理模型,比如去年 12 月發布的 Gemini「思考」版本。但 Gemini 2.5?這是他們試圖超越 OpenAI「o」系列的大手筆。
Google 聲稱 Gemini 2.5 Pro 在多項基準測試中超越了他們的舊模型以及競爭對手的頂尖模型。他們針對視覺效果出色的網頁應用程式和可獨立運作的程式設計項目,特別優化了 Gemini 2.5。
在 Aider Polyglot 程式碼編輯測試中,Gemini 2.5 Pro 獲得了 68.6% 的優異成績,擊敗了 OpenAI、Anthropic 和 DeepSeek 的最佳表現。但在 SWE-bench Verified 軟體開發測試中,它達到了 63.8%——足以擊敗 OpenAI 的 o3-mini 和 DeepSeek 的 R1,但未能超越 Anthropic 的 Claude 3.7 Sonnet,後者得分 70.3%。
還有「人類的最後考試」,這是一項涵蓋數學、人文和科學的艱難多模態測試,包含數千道問題。Gemini 2.5 Pro 取得了 18.8% 的成績,優於大多數知名模型。
一推出,Gemini 2.5 Pro 就具備 100 萬 token 的上下文窗口——這就像能一口氣讀完整個《魔戒》系列。很快,他們還計劃將其擴展到 200 萬 token。
Google 目前尚未公開 API 定價,但他們承諾在未來幾週內會透露詳情。
相關文章
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
相關專題推薦
評論 (39)
0/500
Googleがまた新しいAIを発表したね。人間みたいに「考える」時間を設けるって、本当に可能なのかな?倫理的な問題も気になるし、技術が進むほど不安になることもある。でも、これで検索がもっと便利になるなら試してみたいかも😅
C'est marrant comment Google essaie de faire 'réfléchir' ses IA maintenant... Sauf que moi quand je réfléchis je mets 3h à choisir entre deux parfums de glace 😂 Vivement qu'ils améliorent la version Pro pour nos dilemmes du quotidien !
Whoa, Google’s Gemini 2.5 sounds like it’s got a brain of its own, pausing to ‘think’ before answering! 😮 Makes me wonder if it’ll outsmart us at pub quizzes soon. Cool tech, but I hope it doesn’t start overanalyzing my bad jokes.
Google's Gemini 2.5 sounds like a brainy upgrade! I wonder if it’ll outsmart my math homework. 🤓 Excited to see how it stacks up against other AI models.
Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔

週二,Google 推出了 Gemini 2.5,這是一組全新的 AI 模型,會在給出答案前「思考」片刻。就像它們在試圖模仿我們人類,對吧?
領銜的是 Gemini 2.5 Pro Experimental,Google 宣稱這是迄今為止他們最聰明的模型。這款強大的模型支援多模態,能輕鬆應對推理任務。你可以從週二開始在 Google AI Studio 上體驗它,或者如果你每月支付 20 美元訂閱 Gemini Advanced,就可透過 Gemini 應用程式使用它。
Google 對推理功能非常認真——他們計劃將其融入未來所有的 AI 模型中。
自從 OpenAI 在 2024 年 9 月推出了首個 AI 推理模型 o1 後,科技界一直在競相追趕。現在,Anthropic、DeepSeek、Google 和 xAI 都紛紛推出自己的推理模型。這些模型需要更多時間和計算能力來驗證事實並思考問題,然後才給出答案。
推理技術對 AI 來說是一大突破,特別是在數學和程式設計領域。許多科技界人士認為,這些推理模型對 AI 代理至關重要——那些無需人類監督就能自主完成任務的系統。不過,沒錯,它們的成本也更高。
Google 對此並不陌生——他們之前已經嘗試過推理模型,比如去年 12 月發布的 Gemini「思考」版本。但 Gemini 2.5?這是他們試圖超越 OpenAI「o」系列的大手筆。
Google 聲稱 Gemini 2.5 Pro 在多項基準測試中超越了他們的舊模型以及競爭對手的頂尖模型。他們針對視覺效果出色的網頁應用程式和可獨立運作的程式設計項目,特別優化了 Gemini 2.5。
在 Aider Polyglot 程式碼編輯測試中,Gemini 2.5 Pro 獲得了 68.6% 的優異成績,擊敗了 OpenAI、Anthropic 和 DeepSeek 的最佳表現。但在 SWE-bench Verified 軟體開發測試中,它達到了 63.8%——足以擊敗 OpenAI 的 o3-mini 和 DeepSeek 的 R1,但未能超越 Anthropic 的 Claude 3.7 Sonnet,後者得分 70.3%。
還有「人類的最後考試」,這是一項涵蓋數學、人文和科學的艱難多模態測試,包含數千道問題。Gemini 2.5 Pro 取得了 18.8% 的成績,優於大多數知名模型。
一推出,Gemini 2.5 Pro 就具備 100 萬 token 的上下文窗口——這就像能一口氣讀完整個《魔戒》系列。很快,他們還計劃將其擴展到 200 萬 token。
Google 目前尚未公開 API 定價,但他們承諾在未來幾週內會透露詳情。
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
Googleがまた新しいAIを発表したね。人間みたいに「考える」時間を設けるって、本当に可能なのかな?倫理的な問題も気になるし、技術が進むほど不安になることもある。でも、これで検索がもっと便利になるなら試してみたいかも😅
C'est marrant comment Google essaie de faire 'réfléchir' ses IA maintenant... Sauf que moi quand je réfléchis je mets 3h à choisir entre deux parfums de glace 😂 Vivement qu'ils améliorent la version Pro pour nos dilemmes du quotidien !
Whoa, Google’s Gemini 2.5 sounds like it’s got a brain of its own, pausing to ‘think’ before answering! 😮 Makes me wonder if it’ll outsmart us at pub quizzes soon. Cool tech, but I hope it doesn’t start overanalyzing my bad jokes.
Google's Gemini 2.5 sounds like a brainy upgrade! I wonder if it’ll outsmart my math homework. 🤓 Excited to see how it stacks up against other AI models.
Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔





首頁






