选项
首页
新闻
Google启动高级AI推理模型系列

Google启动高级AI推理模型系列

2025-04-10
155

Google启动高级AI推理模型系列

周二,Google推出了Gemini 2.5,一套全新的AI模型,这些模型在给出答案前会真正“思考”片刻。就像它们在试图模仿我们人类,对吧?

领头的是Gemini 2.5 Pro Experimental,Google宣称这是他们迄今最智能的模型。这个厉害的家伙是多模态的,能像冠军一样处理推理任务。从周二开始,你可以在Google AI Studio上体验它,或者如果你每月支付20美元订阅Gemini Advanced,你可以通过Gemini应用访问它。

Google对推理功能非常重视——他们计划将其融入未来所有的AI模型中。

自从OpenAI在2024年9月发布了首个AI推理模型o1以来,科技界一直在奋力追赶。现在,Anthropic、DeepSeek、Google和xAI都在推出自己的推理模型。这些模型需要更多时间和计算能力来核查事实并思考问题,然后再给出答案。

推理技术对AI来说是个游戏规则的改变者,特别是在数学和编码方面。科技界的许多人认为,这些推理模型对AI代理——那些无需人类监督就能自主完成任务的系统——至关重要。不过,它们的成本也更高。

Google对此并不陌生——他们之前已经尝试过推理模型,比如去年12月发布的那个“思考”版本的Gemini。但Gemini 2.5?这是他们向OpenAI的“o”系列发起的重大挑战。

Google声称Gemini 2.5 Pro在多项基准测试中超越了他们的旧模型和竞争对手的一些顶级模型。他们定制了Gemini 2.5,使其在视觉上惊艳的网页应用和能够独立运行的编码项目中表现出色。

在Aider Polyglot代码编辑测试中,Gemini 2.5 Pro取得了68.6%的优异成绩,击败了OpenAI、Anthropic和DeepSeek的最佳模型。但在SWE-bench Verified软件开发测试中,它达到了63.8%——足以击败OpenAI的o3-mini和DeepSeek的R1,但未能超过Anthropic的Claude 3.7 Sonnet,后者得分70.3%。

还有Humanity's Last Exam,这是一个包含数学、人文学科和科学等数千道题目的复杂多模态测试。Gemini 2.5 Pro取得了18.8%的成绩,优于大多数知名模型。

一经推出,Gemini 2.5 Pro就具备100万个令牌的上下文窗口——这就像能一口气读完整个《指环王》系列。而且很快,他们计划将其扩展到200万个令牌。

Google目前尚未公开API定价,但他们承诺将在未来几周内公布详情。

相关文章
Google I/O 2026 发布 Gmail 收件箱语音交互功能 Google I/O 2026 发布 Gmail 收件箱语音交互功能 谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
谷歌在印度的Chrome浏览器中推出Gemini 谷歌在印度的Chrome浏览器中推出Gemini 周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者 YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者 周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
相关专题推荐
写作 最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字
最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字

在 XIX.AI 探索 2026 年最佳免费且难以被察觉的 AI 写作工具。我们精心筛选的顶级推荐清单,助您将生硬的草稿转化为自然流畅、宛如人类撰写的文字。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即解锁您的 AI 写作优势。

10 个工具
xix.ai
图像编辑 用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计
用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计

2026最新推荐:探索最适合用于短剧故事板制作的AI艺术生成工具。我们精心挑选了众多顶级工具,帮助您创作出引人入胜的幻想角色和都市浪漫角色。您可以对比免费与付费选项,查看实际测试结果,从而找到最适合自己的创意工具。XIX.AI还会每周更新排名并提供专家分析,让您立即开始将故事可视化呈现吧!

10 个工具
xix.ai
写作 最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告
最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告

在XIX.AI上,发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能,帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名,您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧!

10 个工具
xix.ai
商业 最佳 AI 合同审查软件:即时发现法律漏洞与合规风险
最佳 AI 合同审查软件:即时发现法律漏洞与合规风险

在 XIX.AI 上探索 2026 年最佳 AI 合同审查软件。我们精心筛选的顶级榜单汇集了功能强大的工具,能够即时发现法律漏洞和合规风险。通过实际测试和每周更新的排名,对比免费与付费选项。找到能彻底改变游戏规则的解决方案,实现安全、高效的合同分析。立即探索这本权威指南。

10 个工具
xix.ai
动画创作 专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像
专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具,能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项,找到最适合你的创作工具,今天就在XIX.AI上将你的故事变为现实吧。

10 个工具
xix.ai
漫画创作 漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩
漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩

立即访问 XIX.AI,探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案,这些工具能以零一致性错误的方式应用平涂色彩,从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜,找到最适合您的工具。立即开启您的 AI 优势。

10 个工具
xix.ai
评论 (39)
0/500
FrankJackson
FrankJackson 2026-05-13 18:00:10

Googleがまた新しいAIを発表したね。人間みたいに「考える」時間を設けるって、本当に可能なのかな?倫理的な問題も気になるし、技術が進むほど不安になることもある。でも、これで検索がもっと便利になるなら試してみたいかも😅

AndrewAllen
AndrewAllen 2025-09-26 16:31:28

C'est marrant comment Google essaie de faire 'réfléchir' ses IA maintenant... Sauf que moi quand je réfléchis je mets 3h à choisir entre deux parfums de glace 😂 Vivement qu'ils améliorent la version Pro pour nos dilemmes du quotidien !

JasonRamirez
JasonRamirez 2025-08-24 21:01:19

Whoa, Google’s Gemini 2.5 sounds like it’s got a brain of its own, pausing to ‘think’ before answering! 😮 Makes me wonder if it’ll outsmart us at pub quizzes soon. Cool tech, but I hope it doesn’t start overanalyzing my bad jokes.

EricMiller
EricMiller 2025-08-10 17:01:00

Google's Gemini 2.5 sounds like a brainy upgrade! I wonder if it’ll outsmart my math homework. 🤓 Excited to see how it stacks up against other AI models.

RonaldMartinez
RonaldMartinez 2025-04-24 12:43:27

Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔

RalphHill
RalphHill 2025-04-22 22:53:21

O Gemini 2.5 é bem legal, mas às vezes demora muito para 'pensar'. Entendo que está tentando ser mais humano, mas quando preciso de respostas rápidas, é um pouco frustrante. Ainda assim, é mais inteligente que a maioria dos AIs por aí! 🤖💭

OR