選項
首頁
新聞
Google 推出 Gemini Deep Think AI,用於平行推理和想法測試

Google 推出 Gemini Deep Think AI,用於平行推理和想法測試

2025-11-12
86

Google DeepMind 推出 Gemini 2.5 Deep Think,這是他們迄今為止最精密的 AI 推理模型。這個創新的系統可以同時分析多個思考路徑,然後再選出最佳解決方案。

自本週五起,Google 每月 250 美元的 Ultra 高級方案訂閱者將可透過 Gemini 應用程式,獨享 Gemini 2.5 Deep Think 的使用權。

Gemini 2.5 Deep Think 於 2025 年 Google I/O 週年大會上首次亮相,代表 Google 首次公開多代理模式。該系統同時部署多個 AI 代理來處理複雜的查詢,需要更強大的運算能力,但卻能產生更優異的結果。

Gemini 2.5 Deep Think 的專用版本在今年的國際數學奧林匹克比賽中獲得金牌。

Google 在開發 Gemini 2.5 Deep Think 的同時,也與數學家和學者分享 IMO 獲獎模型。有別於傳統 AI 模型的即時反應,這個以研究為重點的版本需要數小時的推理時間。該公司的目標是透過這項計畫,精進學術應用的多重代理技術。

Google 強調 Gemini 2.5 Deep Think 自首次 I/O 公佈以來的重大進展,包括優化模型推理能力的新型強化學習技術。

"Google 在 TechCrunch 獨家部落格文章中表示:「Deep Think 擅於解決需要創意思維、策略規劃與迭代精進的問題。

科技與創投重量級人物加入 Disrupt 2025 議程

包括 Netflix、ElevenLabs、Wayve 和 Sequoia Capital 在內的業界領導者將成為 TechCrunch Disrupt 2025 的主角。在我們里程碑式的 20 週年活動中,獲得轉型的洞察力,以推動您的創業公司成長。立即購買門票,即可在價格上漲前享有高達 675 美元的獨家優惠。

科技與創投重量級人物加入 Disrupt 2025 議程

包括 Netflix、ElevenLabs、Wayve 和 Sequoia Capital 在內的業界領導者將擔任 TechCrunch Disrupt 2025 的主講嘉賓。在我們里程碑式的 20 週年活動中,獲得轉型的洞察力,以推動您的創業公司成長。立即購買門票,即可在價格上漲前享有高達 675 美元的獨家優惠。

Gemini 2.5 Deep Think 在人類最後一次考試 (Humanity's Last Exam, HLE) 中設立新標準,這是一項跨學科測試人工智能的綜合評估。Google 報告在不使用外部工具的情況下,準確率達 34.8%,超越競爭對手 Grok 4 (25.4%) 與 OpenAI 的 o3 (20.3%)。

在競爭激烈的程式設計任務中,該模型也以 87.6% 的優異成績稱霸 LiveCodeBench 6,超越 Grok 4 (79%) 和 OpenAI 的 o3 (72%)。

基準分數圖片來源:Google

Gemini 2.5 Deep Think 可與程式設計環境和搜尋工具無縫整合,同時產生比傳統 AI 系統更廣泛的輸出。

Google 的內部測試顯示,該模型能產生異常詳細的網頁開發解決方案,有可能加速科學突破。

由 Google 的 AII 製作的藝術場景圖片資料來源:Google

領先的人工智能研究人員越來越多地採用多代理體架構。

xAI 的 Grok 4 Heavy 和 OpenAI 未發佈的 IMO 模型都採用了多代理系統,Anthropic 的研究型 AI 也是如此。雖然這些系統展現出優異的效能,但其營運成本卻使其必須以較高的價格階層來訂價。

Google 計劃在未來幾週內限制 Gemini 2.5 Deep Think 的 API 存取權限,以探索企業與開發人員的應用。

相關文章
Google 在印度的 Chrome 瀏覽器中推出 Gemini Google 在印度的 Chrome 瀏覽器中推出 Gemini 週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者 YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者 週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
YouTube 測試由人工智慧驅動的搜尋功能,提供引導式答案 YouTube 測試由人工智慧驅動的搜尋功能,提供引導式答案 許多用戶在搜尋食譜或旅遊計畫時,都會轉向 YouTube 尋找相關影片。如今,該平台推出了一款由人工智慧驅動的互動式搜尋工具,能提供結合文字與影片內容的逐步指引結果。透過全新的「Ask YouTube」功能,使用者可以提出諸如「規劃從舊金山到聖塔芭芭拉的 3 天自駕遊」這類問題,並獲得結合文字、短片片段及較長影片的逐步指引結果——而非僅顯示影片結果。YouTube 表示,系統將同時顯示影片、相關片
相關專題推薦
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
生產率 AI 個人健康與專注力教練:管理倦怠感並提升精神能量
AI 個人健康與專注力教練:管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具,助您管理倦怠感並提升精神能量。透過實際使用心得,比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具
xix.ai
聊天機器人 最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係
最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人,助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較,以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶,並開始建立這段關係吧。

10 個工具
xix.ai
教育與學習 最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程
最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程

探索2026年最優秀的人工智慧資料科學導師,幫助他們掌握SQL、Pandas以及機器學習工作流程。在XIX.AI上檢視我們精心挑選的頂級導師名單,獲得強大而具有變革性的指導。透過對比免費和付費選項,並結合實際應用案例進行了解,今天就開啟你的資料科學精通之路吧。

10 個工具
xix.ai
聊天機器人 最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信
最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信

在 XIX.AI 探索 2026 年最頂尖的 AI 調情與對話訓練工具。我們精心挑選、評價最高的精選清單,能助您即時建立社交魅力與自信。探索這些必試且能徹底改變遊戲規則的工具,並透過免費與付費版本的比較,以及每週更新的排行榜,立即解鎖您的社交優勢。

10 個工具
xix.ai
代碼 最適合自動化單元測試的最佳AI工具:一鍵生成Jest、PyTest和JUnit測試用例
最適合自動化單元測試的最佳AI工具:一鍵生成Jest、PyTest和JUnit測試用例

探索2026年最新評選出的頂級AI工具,這些工具專為自動化單元測試而設計。我們精心挑選了那些功能強大、能夠改變開發流程的工具,它們能夠幫助您快速生成Jest、PyTest和JUnit測試用例。在XIX.AI平臺上,您可以免費檢視各種選項,並透過實際測試結果以及每週更新的排名來了解它們的優劣。立即利用這些AI工具,提升您的開發效率吧!

10 個工具
xix.ai
評論 (1)
0/500
FrankMartínez
FrankMartínez 2026-05-25 10:00:35

Interesting approach! Parallel reasoning could really speed up complex problem-solving, but I wonder how they ensure the 'optimal' solution isn't just the most predictable one? The testing feature sounds useful for prototyping ideas quickly. Hope it's accessible beyond just high-tier subscribers soon. 🤔

OR