谷歌称双子座 2.5 Pro 在编码基准测试中优于 DeepSeek R1 和 Grok 3 Beta
谷歌发布了其旗舰产品 Gemini 2.5 Pro 的更新预览版。这一迭代被称为该公司迄今为止 "最智能 "的人工智能,目前处于预览阶段,计划在几周内全面上市。
企业现在可以尝试使用 Gemini 2.5 Pro 的更新 "I/O 版 "开发新应用或升级现有实施。根据谷歌的官方公告,与之前的迭代版本相比,该版本提供了更具想象力的响应,并展示了编程和逻辑推理方面的卓越能力。
我们最新的双子座 2.5 Pro 更新现已进入预览阶段。
它在编码、推理、科学和数学方面表现更佳,在主要基准测试(AIDER Polyglot、GPQA、HLE 等)中的表现也有所改善,而且 @lmarena_ai 的 Elo 分数比前一版本提高了 24pt。
我们还... pic.twitter.com/SVjdQ2k1tJ
- 桑达尔-皮查伊(@sundarpichai) 2025 年 6 月 5 日
在 5 月份的开发者大会上,谷歌披露了 Gemini 2.5 Pro 的增强功能,这些增强功能超越了其早期的静默版本。谷歌 DeepMind 首席执行官德米斯-哈萨比斯(Demis Hassabis)强调,I/O 版是该公司迄今为止最先进的编码模型。
最新的预览版被命名为 Gemini 2.5 Pro Preview 06-05 Thinking,其功能超越了 I/O 版。即将发布的公开版本承诺提供企业级的性能和可扩展性。
最初的I/O版(gemini-2.5-pro-preview-05-06)已于5月通过谷歌人工智能工作室(Google AI Studio)和顶点人工智能(Vertex AI)向开发人员和企业开放。增强版 Gemini 2.5 预览版 06-05 Thinking 也可通过这些渠道获得。
性能指标
升级后的 Gemini 2.5 Pro 与前代产品相比,性能有了显著提高。
谷歌报告称,Gemini 2.5 Pro 在 LMArena 中提升了 24 分,在 WebDevArena 中提升了 35 分,目前在竞争对手排名中遥遥领先。对比测试显示,该产品在与 OpenAI 的 o3、o3-mini 和 o4-mini、Anthropic 的 Claude 4 Opus、xAI 的 Grok 3 Beta 和 DeepSeek R1 等型号的对比中表现出色。
"谷歌在公告中表示:"我们还解决了之前发布的 2.5 Pro 中的反馈问题,改进了它的风格和结构--它可以通过格式更好的回复来提高创造力。

企业可以期待的
虽然谷歌快速双子座 2.5 Pro 的增强功能看似复杂,但该公司将其定位为对用户输入的直接回应。新版本的定价结构为每百万输入代币 1.25 美元(不含缓存),每百万输出代币 10 美元。
当 Gemini 2.5 Pro 于今年 3 月首次亮相时,行业观察家认为它是一种未得到充分利用的先进模式。此后,谷歌将该技术嵌入到众多应用中,包括 "深度思考 "功能,该功能可在生成响应之前评估多个假设。
Gemini 2.5 Pro 的发布和后续升级巩固了谷歌在竞争激烈的大型语言模型领域的地位,从 DeepSeek 和 OpenAI 的竞争对手推理模型手中夺回了注意力。
在发布后的几个小时内,开发人员就开始测试更新后的 Gemini 2.5 Pro。尽管对其增强功能的全面评估仍在进行中,但早期印象证实了谷歌关于性能加速的说法。
使用 "双子座 2.5 Pro 预览版 06-05" 的第一个小时
优点
- 速度更快
- 输出更多
- 更好的宏播放(多文件编辑,更好的概览)
- 输出结构更好(可读性强)
- 更简洁,更少道歉!!
以前:"你绝对...
- Patrick Bade (@nishffx) 2025 年 6 月 5 日
你们做的饭,真的很喜欢应用程序生成器。
我制作了一个游戏并进行了测试,它是使用 imagen 即时创建资产的。这是目前最好的无经验无代码生成器。
继续建设 vibe 应用程序市场,这可能...
- bone (@boneGPT) 2025 年 6 月 5 日
双子座 2.5 预览版相当不错。昨天用它进行了深入研究,结果比一些大牌软件更好。
- Janak (@janaks09) 2025 年 6 月 5 日
相关文章
谷歌在首页应用试运行中推出 9 项令人兴奋的新功能
谷歌 Home 应用程序在 2025 预览版中推出重大更新谷歌(Google)大幅增强了其 Home 应用程序,目前公开预览版中提供了多项突破性功能。智能家居爱好者现在可以在 Google TV 设备上享受 Nest Cam 的画中画功能,从而可以直接在电视屏幕上方便地监控安全信息。这一期待已久的功能虽然不言自明,但对谷歌生态系统用户来说却是生活质量的重大提升。谷歌 Home 应用程序界面中的扩展
谷歌双子座聊天机器人增强了 GitHub 项目分析能力
双子座高级版整合 GitHub 连接功能从本周三开始,谷歌 Gemini Advanced 高级用户(20 美元/月)现在可以直接将 GitHub 存储库链接到人工智能助手。这种集成使用户能够在整个代码库中利用 Gemini 的功能,从生成新功能到解决有问题的部分。连接过程非常简单:点击 "+"提示栏按钮选择 "导入代码粘贴 GitHub 代码库 URL增强编码功能Gemini Advanced
谷歌双子座人工智能推出照片到视频转换功能
谷歌最新的双子座更新引入了由 Veo 3 模型驱动的突破性照片到视频转换功能。这一创新功能可将静态图像转换为 8 秒钟的视频片段,并加入人工智能生成的音频元素,如环境音、背景噪音甚至合成语音。目前,Gemini Ultra 和 Pro 用户正在部分地区推出网络版,本周将推出移动版。实施细节新的动画功能可无缝集成到 Gemini 现有的工作流程中。用户可通过以下方式激活该功能在提示界面中选
评论 (0)
0/200
谷歌发布了其旗舰产品 Gemini 2.5 Pro 的更新预览版。这一迭代被称为该公司迄今为止 "最智能 "的人工智能,目前处于预览阶段,计划在几周内全面上市。
企业现在可以尝试使用 Gemini 2.5 Pro 的更新 "I/O 版 "开发新应用或升级现有实施。根据谷歌的官方公告,与之前的迭代版本相比,该版本提供了更具想象力的响应,并展示了编程和逻辑推理方面的卓越能力。
我们最新的双子座 2.5 Pro 更新现已进入预览阶段。
它在编码、推理、科学和数学方面表现更佳,在主要基准测试(AIDER Polyglot、GPQA、HLE 等)中的表现也有所改善,而且 @lmarena_ai 的 Elo 分数比前一版本提高了 24pt。
我们还... pic.twitter.com/SVjdQ2k1tJ
- 桑达尔-皮查伊(@sundarpichai) 2025 年 6 月 5 日
在 5 月份的开发者大会上,谷歌披露了 Gemini 2.5 Pro 的增强功能,这些增强功能超越了其早期的静默版本。谷歌 DeepMind 首席执行官德米斯-哈萨比斯(Demis Hassabis)强调,I/O 版是该公司迄今为止最先进的编码模型。
最新的预览版被命名为 Gemini 2.5 Pro Preview 06-05 Thinking,其功能超越了 I/O 版。即将发布的公开版本承诺提供企业级的性能和可扩展性。
最初的I/O版(gemini-2.5-pro-preview-05-06)已于5月通过谷歌人工智能工作室(Google AI Studio)和顶点人工智能(Vertex AI)向开发人员和企业开放。增强版 Gemini 2.5 预览版 06-05 Thinking 也可通过这些渠道获得。
性能指标
升级后的 Gemini 2.5 Pro 与前代产品相比,性能有了显著提高。
谷歌报告称,Gemini 2.5 Pro 在 LMArena 中提升了 24 分,在 WebDevArena 中提升了 35 分,目前在竞争对手排名中遥遥领先。对比测试显示,该产品在与 OpenAI 的 o3、o3-mini 和 o4-mini、Anthropic 的 Claude 4 Opus、xAI 的 Grok 3 Beta 和 DeepSeek R1 等型号的对比中表现出色。
"谷歌在公告中表示:"我们还解决了之前发布的 2.5 Pro 中的反馈问题,改进了它的风格和结构--它可以通过格式更好的回复来提高创造力。

企业可以期待的
虽然谷歌快速双子座 2.5 Pro 的增强功能看似复杂,但该公司将其定位为对用户输入的直接回应。新版本的定价结构为每百万输入代币 1.25 美元(不含缓存),每百万输出代币 10 美元。
当 Gemini 2.5 Pro 于今年 3 月首次亮相时,行业观察家认为它是一种未得到充分利用的先进模式。此后,谷歌将该技术嵌入到众多应用中,包括 "深度思考 "功能,该功能可在生成响应之前评估多个假设。
Gemini 2.5 Pro 的发布和后续升级巩固了谷歌在竞争激烈的大型语言模型领域的地位,从 DeepSeek 和 OpenAI 的竞争对手推理模型手中夺回了注意力。
在发布后的几个小时内,开发人员就开始测试更新后的 Gemini 2.5 Pro。尽管对其增强功能的全面评估仍在进行中,但早期印象证实了谷歌关于性能加速的说法。
使用 "双子座 2.5 Pro 预览版 06-05" 的第一个小时
优点
- 速度更快
- 输出更多
- 更好的宏播放(多文件编辑,更好的概览)
- 输出结构更好(可读性强)
- 更简洁,更少道歉!!以前:"你绝对...
- Patrick Bade (@nishffx) 2025 年 6 月 5 日
你们做的饭,真的很喜欢应用程序生成器。
我制作了一个游戏并进行了测试,它是使用 imagen 即时创建资产的。这是目前最好的无经验无代码生成器。
继续建设 vibe 应用程序市场,这可能...
- bone (@boneGPT) 2025 年 6 月 5 日
双子座 2.5 预览版相当不错。昨天用它进行了深入研究,结果比一些大牌软件更好。
- Janak (@janaks09) 2025 年 6 月 5 日
谷歌在首页应用试运行中推出 9 项令人兴奋的新功能
谷歌 Home 应用程序在 2025 预览版中推出重大更新谷歌(Google)大幅增强了其 Home 应用程序,目前公开预览版中提供了多项突破性功能。智能家居爱好者现在可以在 Google TV 设备上享受 Nest Cam 的画中画功能,从而可以直接在电视屏幕上方便地监控安全信息。这一期待已久的功能虽然不言自明,但对谷歌生态系统用户来说却是生活质量的重大提升。谷歌 Home 应用程序界面中的扩展
谷歌双子座聊天机器人增强了 GitHub 项目分析能力
双子座高级版整合 GitHub 连接功能从本周三开始,谷歌 Gemini Advanced 高级用户(20 美元/月)现在可以直接将 GitHub 存储库链接到人工智能助手。这种集成使用户能够在整个代码库中利用 Gemini 的功能,从生成新功能到解决有问题的部分。连接过程非常简单:点击 "+"提示栏按钮选择 "导入代码粘贴 GitHub 代码库 URL增强编码功能Gemini Advanced
谷歌双子座人工智能推出照片到视频转换功能
谷歌最新的双子座更新引入了由 Veo 3 模型驱动的突破性照片到视频转换功能。这一创新功能可将静态图像转换为 8 秒钟的视频片段,并加入人工智能生成的音频元素,如环境音、背景噪音甚至合成语音。目前,Gemini Ultra 和 Pro 用户正在部分地区推出网络版,本周将推出移动版。实施细节新的动画功能可无缝集成到 Gemini 现有的工作流程中。用户可通过以下方式激活该功能在提示界面中选




