Google 表示 Gemini 2.5 Pro 在編碼基準測試中表現優於 DeepSeek R1 和 Grok 3 Beta
Google 推出了旗艦機種 Gemini 2.5 Pro 的更新預覽版,該機種最初於 3 月推出,並於 5 月進行了增強。此迭代版本被描述為該公司迄今「最智慧」的 AI,目前正處於預覽階段,並計劃在幾週內全面上市。
企業現在可以嘗試使用 Gemini 2.5 Pro 的更新「I/O 版」開發新應用程式或升級現有實作。根據 Google 的官方宣佈,與先前的迭代版本相比,此版本可提供更富想像力的回應,並在程式設計和邏輯推理方面展現出更卓越的能力。
我們最新的 Gemini 2.5 Pro 更新已進入預覽階段。
它在編碼、推理、科學 + 數學方面更勝一籌,在關鍵基準(AIDER Polyglot、GPQA、HLE 等)上表現更佳,並領導 @lmarena_ai 的 Elo 分數自前一版本躍升 24pt。
我們也... pic.twitter.com/SVjdQ2k1tJ
- Sundar Pichai (@sundarpichai) 2025 年 6 月 5 日
在 5 月的開發者大會上,Google 揭露了 Gemini 2.5 Pro 的強化功能,超越了先前的靜音版本。Google DeepMind 執行長 Demis Hassabis 強調,I/O 版是該公司迄今為止最先進的編碼模型。
這個最新的預覽版,命名為 Gemini 2.5 Pro Preview 06-05 Thinking,其功能超越了 I/O 版。即將推出的公開版本承諾提供企業級的效能與擴充性。
原始的 I/O 版本 (gemini-2.5-pro-preview-05-06) 已於 5 月透過 Google AI Studio 和 Vertex AI 供開發人員和企業使用。增強版 Gemini 2.5 預覽 06-05 Thinking 也可透過這些相同的管道取得。
效能指標
升級後的 Gemini 2.5 Pro 較上一代有顯著的進步。
Google 報告在 LMArena 中提升了 24 分,在 WebDevArena 中提升了 35 分,目前在競爭對手的排名中遙遙領先。比較測試顯示,與 OpenAI 的 o3、o3-mini 和 o4-mini、Anthropic 的 Claude 4 Opus、xAI 的 Grok 3 Beta 和 DeepSeek R1 等機種比較,其效能更勝一籌。
"Google 在公告中表示:「我們也處理了之前 2.5 Pro 版本的回饋意見,改善了它的風格和結構 - 它可以用更好格式的回應來表現更多創意。

企業可以期待的
雖然 Google 的快速 Gemini 2.5 Pro 增強功能看似複雜,但該公司將其定位為對使用者輸入的直接回應。新版本的定價結構為每百萬個輸入代幣 1.25 美元 (不含快取),以及每百萬個輸出代幣 10 美元。
當 Gemini 2.5 Pro 在 3 月首次亮相時,業界觀察家認為這是一個未被充分利用的進階模式。自此之後,Google 已將這項技術嵌入許多應用程式,包括「深度思考」功能,可在產生回應之前評估多項假設。
Gemini 2.5 Pro 的推出以及隨後的升級鞏固了 Google 在競爭激烈的大型語言模型領域中的地位,從 DeepSeek 和 OpenAI 等競爭對手的推理模型手中奪回了注意力。
Gemini 2.5 Pro 公佈後數小時內,開發人員就開始測試更新後的 Gemini 2.5 Pro。早期的印象證實了 Google 所聲稱的加速效能,不過對其增強功能的全面評估仍在進行中。
使用「Gemini 2.5 Pro 預覽版 06-05 」的第一個小時
好處:
- 速度更快
- 輸出更多
- 它有更好的巨集播放(多檔案編輯,更好的概述)
- 輸出結構更好(可讀)
- 它更簡潔,更少道歉!!
之前:"您絕對...
- Patrick Bade (@nishffx) 2025 年 6 月 5 日
你們煮的東西,真的很喜歡應用程式建置工具。
我製作了一個遊戲並測試了一下,它是使用 imagen 來快速建立資產,而且它已經架設、託管、容易分享。真的是目前最好的無經驗無程式碼建立工具。
繼續建立 vibe 應用程式市場,這可能...
- bone (@boneGPT) 2025 年 6 月 5 日
Gemini 2.5 預覽版相當不錯。昨天用它來做深度研究,結果比一些大名鼎鼎的公司還要好...
- Janak (@janaks09) 2025 年 6 月 5 日
相關文章
Google 在 Home App 軟體發表會中推出 9 項令人興奮的新功能
Google Home 應用程式在 2025 預覽版中推出重大更新Google 已大幅強化其 Home 應用程式,目前提供數項突破性功能的公開預覽。智能家居愛好者現在可以在 Google TV 裝置上享受 Nest Cam 的畫中畫功能,方便地直接在電視螢幕上監控安全訊息。這項期待已久的功能,對 Google 的生態系統使用者來說,是生活品質的大幅提升。Google Home 應用程式介面新增更多
Google Gemini 聊天機獲得增強的 GitHub 專案分析功能
Gemini Advanced 整合 GitHub 連線功能Google 的 Gemini Advanced 高階訂閱者 ($20/month) 現在可以直接將 GitHub 儲存庫連結至 AI 助理。這項整合讓使用者可以在整個程式碼庫中運用 Gemini 的功能 - 從產生新功能到疑難排解。連接過程非常簡化:按一下「+」提示列按鈕選擇「匯入程式碼貼上 GitHub 儲存庫 URL增強的編碼能力G
Google 的 Gemini AI 推出照片轉影片功能
Google 最新的 Gemini 更新推出了由 Veo 3 模型驅動的突破性照片到視訊轉換功能。這項創新功能可將靜態影像轉換成 8 秒鐘的視訊片段,並加入 AI 產生的音訊元素,例如環境聲音、背景噪音,甚至是合成語音。目前,Gemini Ultra 和 Pro 訂戶已在特定區域推出,網頁版本於今日推出,手機版本將於本周內推出。實施細節新的動畫功能可與 Gemini 現有的工作流程無縫整合。
評論 (0)
0/200
Google 推出了旗艦機種 Gemini 2.5 Pro 的更新預覽版,該機種最初於 3 月推出,並於 5 月進行了增強。此迭代版本被描述為該公司迄今「最智慧」的 AI,目前正處於預覽階段,並計劃在幾週內全面上市。
企業現在可以嘗試使用 Gemini 2.5 Pro 的更新「I/O 版」開發新應用程式或升級現有實作。根據 Google 的官方宣佈,與先前的迭代版本相比,此版本可提供更富想像力的回應,並在程式設計和邏輯推理方面展現出更卓越的能力。
我們最新的 Gemini 2.5 Pro 更新已進入預覽階段。
它在編碼、推理、科學 + 數學方面更勝一籌,在關鍵基準(AIDER Polyglot、GPQA、HLE 等)上表現更佳,並領導 @lmarena_ai 的 Elo 分數自前一版本躍升 24pt。
我們也... pic.twitter.com/SVjdQ2k1tJ
- Sundar Pichai (@sundarpichai) 2025 年 6 月 5 日
在 5 月的開發者大會上,Google 揭露了 Gemini 2.5 Pro 的強化功能,超越了先前的靜音版本。Google DeepMind 執行長 Demis Hassabis 強調,I/O 版是該公司迄今為止最先進的編碼模型。
這個最新的預覽版,命名為 Gemini 2.5 Pro Preview 06-05 Thinking,其功能超越了 I/O 版。即將推出的公開版本承諾提供企業級的效能與擴充性。
原始的 I/O 版本 (gemini-2.5-pro-preview-05-06) 已於 5 月透過 Google AI Studio 和 Vertex AI 供開發人員和企業使用。增強版 Gemini 2.5 預覽 06-05 Thinking 也可透過這些相同的管道取得。
效能指標
升級後的 Gemini 2.5 Pro 較上一代有顯著的進步。
Google 報告在 LMArena 中提升了 24 分,在 WebDevArena 中提升了 35 分,目前在競爭對手的排名中遙遙領先。比較測試顯示,與 OpenAI 的 o3、o3-mini 和 o4-mini、Anthropic 的 Claude 4 Opus、xAI 的 Grok 3 Beta 和 DeepSeek R1 等機種比較,其效能更勝一籌。
"Google 在公告中表示:「我們也處理了之前 2.5 Pro 版本的回饋意見,改善了它的風格和結構 - 它可以用更好格式的回應來表現更多創意。

企業可以期待的
雖然 Google 的快速 Gemini 2.5 Pro 增強功能看似複雜,但該公司將其定位為對使用者輸入的直接回應。新版本的定價結構為每百萬個輸入代幣 1.25 美元 (不含快取),以及每百萬個輸出代幣 10 美元。
當 Gemini 2.5 Pro 在 3 月首次亮相時,業界觀察家認為這是一個未被充分利用的進階模式。自此之後,Google 已將這項技術嵌入許多應用程式,包括「深度思考」功能,可在產生回應之前評估多項假設。
Gemini 2.5 Pro 的推出以及隨後的升級鞏固了 Google 在競爭激烈的大型語言模型領域中的地位,從 DeepSeek 和 OpenAI 等競爭對手的推理模型手中奪回了注意力。
Gemini 2.5 Pro 公佈後數小時內,開發人員就開始測試更新後的 Gemini 2.5 Pro。早期的印象證實了 Google 所聲稱的加速效能,不過對其增強功能的全面評估仍在進行中。
使用「Gemini 2.5 Pro 預覽版 06-05 」的第一個小時
好處:
- 速度更快
- 輸出更多
- 它有更好的巨集播放(多檔案編輯,更好的概述)
- 輸出結構更好(可讀)
- 它更簡潔,更少道歉!!之前:"您絕對...
- Patrick Bade (@nishffx) 2025 年 6 月 5 日
你們煮的東西,真的很喜歡應用程式建置工具。
我製作了一個遊戲並測試了一下,它是使用 imagen 來快速建立資產,而且它已經架設、託管、容易分享。真的是目前最好的無經驗無程式碼建立工具。
繼續建立 vibe 應用程式市場,這可能...
- bone (@boneGPT) 2025 年 6 月 5 日
Gemini 2.5 預覽版相當不錯。昨天用它來做深度研究,結果比一些大名鼎鼎的公司還要好...
- Janak (@janaks09) 2025 年 6 月 5 日
Google 在 Home App 軟體發表會中推出 9 項令人興奮的新功能
Google Home 應用程式在 2025 預覽版中推出重大更新Google 已大幅強化其 Home 應用程式,目前提供數項突破性功能的公開預覽。智能家居愛好者現在可以在 Google TV 裝置上享受 Nest Cam 的畫中畫功能,方便地直接在電視螢幕上監控安全訊息。這項期待已久的功能,對 Google 的生態系統使用者來說,是生活品質的大幅提升。Google Home 應用程式介面新增更多
Google Gemini 聊天機獲得增強的 GitHub 專案分析功能
Gemini Advanced 整合 GitHub 連線功能Google 的 Gemini Advanced 高階訂閱者 ($20/month) 現在可以直接將 GitHub 儲存庫連結至 AI 助理。這項整合讓使用者可以在整個程式碼庫中運用 Gemini 的功能 - 從產生新功能到疑難排解。連接過程非常簡化:按一下「+」提示列按鈕選擇「匯入程式碼貼上 GitHub 儲存庫 URL增強的編碼能力G
Google 的 Gemini AI 推出照片轉影片功能
Google 最新的 Gemini 更新推出了由 Veo 3 模型驅動的突破性照片到視訊轉換功能。這項創新功能可將靜態影像轉換成 8 秒鐘的視訊片段,並加入 AI 產生的音訊元素,例如環境聲音、背景噪音,甚至是合成語音。目前,Gemini Ultra 和 Pro 訂戶已在特定區域推出,網頁版本於今日推出,手機版本將於本周內推出。實施細節新的動畫功能可與 Gemini 現有的工作流程無縫整合。




