選項
首頁
新聞
Google啟動高級AI推理模型系列

Google啟動高級AI推理模型系列

2025-04-10
155

Google啟動高級AI推理模型系列

週二,Google 推出了 Gemini 2.5,這是一組全新的 AI 模型,會在給出答案前「思考」片刻。就像它們在試圖模仿我們人類,對吧?

領銜的是 Gemini 2.5 Pro Experimental,Google 宣稱這是迄今為止他們最聰明的模型。這款強大的模型支援多模態,能輕鬆應對推理任務。你可以從週二開始在 Google AI Studio 上體驗它,或者如果你每月支付 20 美元訂閱 Gemini Advanced,就可透過 Gemini 應用程式使用它。

Google 對推理功能非常認真——他們計劃將其融入未來所有的 AI 模型中。

自從 OpenAI 在 2024 年 9 月推出了首個 AI 推理模型 o1 後,科技界一直在競相追趕。現在,Anthropic、DeepSeek、Google 和 xAI 都紛紛推出自己的推理模型。這些模型需要更多時間和計算能力來驗證事實並思考問題,然後才給出答案。

推理技術對 AI 來說是一大突破,特別是在數學和程式設計領域。許多科技界人士認為,這些推理模型對 AI 代理至關重要——那些無需人類監督就能自主完成任務的系統。不過,沒錯,它們的成本也更高。

Google 對此並不陌生——他們之前已經嘗試過推理模型,比如去年 12 月發布的 Gemini「思考」版本。但 Gemini 2.5?這是他們試圖超越 OpenAI「o」系列的大手筆。

Google 聲稱 Gemini 2.5 Pro 在多項基準測試中超越了他們的舊模型以及競爭對手的頂尖模型。他們針對視覺效果出色的網頁應用程式和可獨立運作的程式設計項目,特別優化了 Gemini 2.5。

在 Aider Polyglot 程式碼編輯測試中,Gemini 2.5 Pro 獲得了 68.6% 的優異成績,擊敗了 OpenAI、Anthropic 和 DeepSeek 的最佳表現。但在 SWE-bench Verified 軟體開發測試中,它達到了 63.8%——足以擊敗 OpenAI 的 o3-mini 和 DeepSeek 的 R1,但未能超越 Anthropic 的 Claude 3.7 Sonnet,後者得分 70.3%。

還有「人類的最後考試」,這是一項涵蓋數學、人文和科學的艱難多模態測試,包含數千道問題。Gemini 2.5 Pro 取得了 18.8% 的成績,優於大多數知名模型。

一推出,Gemini 2.5 Pro 就具備 100 萬 token 的上下文窗口——這就像能一口氣讀完整個《魔戒》系列。很快,他們還計劃將其擴展到 200 萬 token。

Google 目前尚未公開 API 定價,但他們承諾在未來幾週內會透露詳情。

相關文章
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能 Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能 Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini Google 在印度的 Chrome 瀏覽器中推出 Gemini 週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者 YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者 週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
相關專題推薦
漫畫創作 AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料
AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料

2026年最新最佳AI角色建立工具:發現那些備受好評的工具,它們能夠幫助你為漫畫角色生成詳細的背景故事和視覺素材。我們精心整理的這份每週更新的列表會根據實際測試結果,對比免費與付費選項的優劣。找到這些強大且能改變創作流程的工具,幫助你塑造引人入勝的角色,提升創作效率。立即訪問XIX.AI檢視排名,找到最適合你的故事創作助手吧。

10 個工具
xix.ai
健康與養生 AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫
AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫

探索 2026 年最佳 AI 孕期輔助工具,為您量身打造安全且針對各孕期的運動與營養計畫。獲取精選的高評分推薦,包含免費與付費方案的比較,以及實用經驗分享。透過 XIX.AI 的專家指南,開啟您最健康的孕期旅程。立即探索。

10 個工具
xix.ai
寫作 最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文
最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文

立即前往 XIX.AI,探索 2026 年最頂尖的免費且難以被察覺的 AI 寫手。我們精心篩選的頂級清單,能協助您將生硬的草稿轉化為自然流暢、宛如人類撰寫的文字。透過實際測試與每週更新的排行榜,比較免費與付費選項的優劣。立即解鎖您的 AI 寫作優勢。

10 個工具
xix.ai
圖像編輯 用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計
用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計

2026最新推薦:探索最適合用於短劇故事板製作的AI藝術生成工具。我們精心挑選了眾多頂級工具,幫助您創作出引人入勝的幻想角色和都市浪漫角色。您可以對比免費與付費選項,檢視實際測試結果,從而找到最適合自己的創意工具。XIX.AI還會每週更新排名並提供專家分析,讓您立即開始將故事視覺化呈現吧!

10 個工具
xix.ai
寫作 最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告
最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告

在XIX.AI上,發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能,幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名,您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧!

10 個工具
xix.ai
商業 最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險
最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具,能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜,比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案,實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具
xix.ai
評論 (39)
0/500
FrankJackson
FrankJackson 2026-05-13 18:00:10

Googleがまた新しいAIを発表したね。人間みたいに「考える」時間を設けるって、本当に可能なのかな?倫理的な問題も気になるし、技術が進むほど不安になることもある。でも、これで検索がもっと便利になるなら試してみたいかも😅

AndrewAllen
AndrewAllen 2025-09-26 16:31:28

C'est marrant comment Google essaie de faire 'réfléchir' ses IA maintenant... Sauf que moi quand je réfléchis je mets 3h à choisir entre deux parfums de glace 😂 Vivement qu'ils améliorent la version Pro pour nos dilemmes du quotidien !

JasonRamirez
JasonRamirez 2025-08-24 21:01:19

Whoa, Google’s Gemini 2.5 sounds like it’s got a brain of its own, pausing to ‘think’ before answering! 😮 Makes me wonder if it’ll outsmart us at pub quizzes soon. Cool tech, but I hope it doesn’t start overanalyzing my bad jokes.

EricMiller
EricMiller 2025-08-10 17:01:00

Google's Gemini 2.5 sounds like a brainy upgrade! I wonder if it’ll outsmart my math homework. 🤓 Excited to see how it stacks up against other AI models.

RonaldMartinez
RonaldMartinez 2025-04-24 12:43:27

Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔

RalphHill
RalphHill 2025-04-22 22:53:21

O Gemini 2.5 é bem legal, mas às vezes demora muito para 'pensar'. Entendo que está tentando ser mais humano, mas quando preciso de respostas rápidas, é um pouco frustrante. Ainda assim, é mais inteligente que a maioria dos AIs por aí! 🤖💭

OR