Google 推出 Gemini Deep Think AI,用於平行推理和想法測試
Google DeepMind 推出 Gemini 2.5 Deep Think,這是他們迄今為止最精密的 AI 推理模型。這個創新的系統可以同時分析多個思考路徑,然後再選出最佳解決方案。
自本週五起,Google 每月 250 美元的 Ultra 高級方案訂閱者將可透過 Gemini 應用程式,獨享 Gemini 2.5 Deep Think 的使用權。
Gemini 2.5 Deep Think 於 2025 年 Google I/O 週年大會上首次亮相,代表 Google 首次公開多代理模式。該系統同時部署多個 AI 代理來處理複雜的查詢,需要更強大的運算能力,但卻能產生更優異的結果。
Gemini 2.5 Deep Think 的專用版本在今年的國際數學奧林匹克比賽中獲得金牌。
Google 在開發 Gemini 2.5 Deep Think 的同時,也與數學家和學者分享 IMO 獲獎模型。有別於傳統 AI 模型的即時反應,這個以研究為重點的版本需要數小時的推理時間。該公司的目標是透過這項計畫,精進學術應用的多重代理技術。
Google 強調 Gemini 2.5 Deep Think 自首次 I/O 公佈以來的重大進展,包括優化模型推理能力的新型強化學習技術。
"Google 在 TechCrunch 獨家部落格文章中表示:「Deep Think 擅於解決需要創意思維、策略規劃與迭代精進的問題。
科技與創投重量級人物加入 Disrupt 2025 議程
包括 Netflix、ElevenLabs、Wayve 和 Sequoia Capital 在內的業界領導者將成為 TechCrunch Disrupt 2025 的主角。在我們里程碑式的 20 週年活動中,獲得轉型的洞察力,以推動您的創業公司成長。立即購買門票,即可在價格上漲前享有高達 675 美元的獨家優惠。
科技與創投重量級人物加入 Disrupt 2025 議程
包括 Netflix、ElevenLabs、Wayve 和 Sequoia Capital 在內的業界領導者將擔任 TechCrunch Disrupt 2025 的主講嘉賓。在我們里程碑式的 20 週年活動中,獲得轉型的洞察力,以推動您的創業公司成長。立即購買門票,即可在價格上漲前享有高達 675 美元的獨家優惠。
Gemini 2.5 Deep Think 在人類最後一次考試 (Humanity's Last Exam, HLE) 中設立新標準,這是一項跨學科測試人工智能的綜合評估。Google 報告在不使用外部工具的情況下,準確率達 34.8%,超越競爭對手 Grok 4 (25.4%) 與 OpenAI 的 o3 (20.3%)。
在競爭激烈的程式設計任務中,該模型也以 87.6% 的優異成績稱霸 LiveCodeBench 6,超越 Grok 4 (79%) 和 OpenAI 的 o3 (72%)。

基準分數圖片來源:Google Gemini 2.5 Deep Think 可與程式設計環境和搜尋工具無縫整合,同時產生比傳統 AI 系統更廣泛的輸出。
Google 的內部測試顯示,該模型能產生異常詳細的網頁開發解決方案,有可能加速科學突破。

由 Google 的 AII 製作的藝術場景圖片資料來源:Google 領先的人工智能研究人員越來越多地採用多代理體架構。
xAI 的 Grok 4 Heavy 和 OpenAI 未發佈的 IMO 模型都採用了多代理系統,Anthropic 的研究型 AI 也是如此。雖然這些系統展現出優異的效能,但其營運成本卻使其必須以較高的價格階層來訂價。
Google 計劃在未來幾週內限制 Gemini 2.5 Deep Think 的 API 存取權限,以探索企業與開發人員的應用。
相關文章
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
YouTube 測試由人工智慧驅動的搜尋功能,提供引導式答案
許多用戶在搜尋食譜或旅遊計畫時,都會轉向 YouTube 尋找相關影片。如今,該平台推出了一款由人工智慧驅動的互動式搜尋工具,能提供結合文字與影片內容的逐步指引結果。透過全新的「Ask YouTube」功能,使用者可以提出諸如「規劃從舊金山到聖塔芭芭拉的 3 天自駕遊」這類問題,並獲得結合文字、短片片段及較長影片的逐步指引結果——而非僅顯示影片結果。YouTube 表示,系統將同時顯示影片、相關片
相關專題推薦
評論 (1)
0/500
Interesting approach! Parallel reasoning could really speed up complex problem-solving, but I wonder how they ensure the 'optimal' solution isn't just the most predictable one? The testing feature sounds useful for prototyping ideas quickly. Hope it's accessible beyond just high-tier subscribers soon. 🤔
Google DeepMind 推出 Gemini 2.5 Deep Think,這是他們迄今為止最精密的 AI 推理模型。這個創新的系統可以同時分析多個思考路徑,然後再選出最佳解決方案。
自本週五起,Google 每月 250 美元的 Ultra 高級方案訂閱者將可透過 Gemini 應用程式,獨享 Gemini 2.5 Deep Think 的使用權。
Gemini 2.5 Deep Think 於 2025 年 Google I/O 週年大會上首次亮相,代表 Google 首次公開多代理模式。該系統同時部署多個 AI 代理來處理複雜的查詢,需要更強大的運算能力,但卻能產生更優異的結果。
Gemini 2.5 Deep Think 的專用版本在今年的國際數學奧林匹克比賽中獲得金牌。
Google 在開發 Gemini 2.5 Deep Think 的同時,也與數學家和學者分享 IMO 獲獎模型。有別於傳統 AI 模型的即時反應,這個以研究為重點的版本需要數小時的推理時間。該公司的目標是透過這項計畫,精進學術應用的多重代理技術。
Google 強調 Gemini 2.5 Deep Think 自首次 I/O 公佈以來的重大進展,包括優化模型推理能力的新型強化學習技術。
"Google 在 TechCrunch 獨家部落格文章中表示:「Deep Think 擅於解決需要創意思維、策略規劃與迭代精進的問題。
科技與創投重量級人物加入 Disrupt 2025 議程
包括 Netflix、ElevenLabs、Wayve 和 Sequoia Capital 在內的業界領導者將成為 TechCrunch Disrupt 2025 的主角。在我們里程碑式的 20 週年活動中,獲得轉型的洞察力,以推動您的創業公司成長。立即購買門票,即可在價格上漲前享有高達 675 美元的獨家優惠。
科技與創投重量級人物加入 Disrupt 2025 議程
包括 Netflix、ElevenLabs、Wayve 和 Sequoia Capital 在內的業界領導者將擔任 TechCrunch Disrupt 2025 的主講嘉賓。在我們里程碑式的 20 週年活動中,獲得轉型的洞察力,以推動您的創業公司成長。立即購買門票,即可在價格上漲前享有高達 675 美元的獨家優惠。
Gemini 2.5 Deep Think 在人類最後一次考試 (Humanity's Last Exam, HLE) 中設立新標準,這是一項跨學科測試人工智能的綜合評估。Google 報告在不使用外部工具的情況下,準確率達 34.8%,超越競爭對手 Grok 4 (25.4%) 與 OpenAI 的 o3 (20.3%)。
在競爭激烈的程式設計任務中,該模型也以 87.6% 的優異成績稱霸 LiveCodeBench 6,超越 Grok 4 (79%) 和 OpenAI 的 o3 (72%)。

Gemini 2.5 Deep Think 可與程式設計環境和搜尋工具無縫整合,同時產生比傳統 AI 系統更廣泛的輸出。
Google 的內部測試顯示,該模型能產生異常詳細的網頁開發解決方案,有可能加速科學突破。

領先的人工智能研究人員越來越多地採用多代理體架構。
xAI 的 Grok 4 Heavy 和 OpenAI 未發佈的 IMO 模型都採用了多代理系統,Anthropic 的研究型 AI 也是如此。雖然這些系統展現出優異的效能,但其營運成本卻使其必須以較高的價格階層來訂價。
Google 計劃在未來幾週內限制 Gemini 2.5 Deep Think 的 API 存取權限,以探索企業與開發人員的應用。
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
YouTube 測試由人工智慧驅動的搜尋功能,提供引導式答案
許多用戶在搜尋食譜或旅遊計畫時,都會轉向 YouTube 尋找相關影片。如今,該平台推出了一款由人工智慧驅動的互動式搜尋工具,能提供結合文字與影片內容的逐步指引結果。透過全新的「Ask YouTube」功能,使用者可以提出諸如「規劃從舊金山到聖塔芭芭拉的 3 天自駕遊」這類問題,並獲得結合文字、短片片段及較長影片的逐步指引結果——而非僅顯示影片結果。YouTube 表示,系統將同時顯示影片、相關片
Interesting approach! Parallel reasoning could really speed up complex problem-solving, but I wonder how they ensure the 'optimal' solution isn't just the most predictable one? The testing feature sounds useful for prototyping ideas quickly. Hope it's accessible beyond just high-tier subscribers soon. 🤔





首頁






