Google启动高级AI推理模型系列

周二,Google推出了Gemini 2.5,一套全新的AI模型,这些模型在给出答案前会真正“思考”片刻。就像它们在试图模仿我们人类,对吧?
领头的是Gemini 2.5 Pro Experimental,Google宣称这是他们迄今最智能的模型。这个厉害的家伙是多模态的,能像冠军一样处理推理任务。从周二开始,你可以在Google AI Studio上体验它,或者如果你每月支付20美元订阅Gemini Advanced,你可以通过Gemini应用访问它。
Google对推理功能非常重视——他们计划将其融入未来所有的AI模型中。
自从OpenAI在2024年9月发布了首个AI推理模型o1以来,科技界一直在奋力追赶。现在,Anthropic、DeepSeek、Google和xAI都在推出自己的推理模型。这些模型需要更多时间和计算能力来核查事实并思考问题,然后再给出答案。
推理技术对AI来说是个游戏规则的改变者,特别是在数学和编码方面。科技界的许多人认为,这些推理模型对AI代理——那些无需人类监督就能自主完成任务的系统——至关重要。不过,它们的成本也更高。
Google对此并不陌生——他们之前已经尝试过推理模型,比如去年12月发布的那个“思考”版本的Gemini。但Gemini 2.5?这是他们向OpenAI的“o”系列发起的重大挑战。
Google声称Gemini 2.5 Pro在多项基准测试中超越了他们的旧模型和竞争对手的一些顶级模型。他们定制了Gemini 2.5,使其在视觉上惊艳的网页应用和能够独立运行的编码项目中表现出色。
在Aider Polyglot代码编辑测试中,Gemini 2.5 Pro取得了68.6%的优异成绩,击败了OpenAI、Anthropic和DeepSeek的最佳模型。但在SWE-bench Verified软件开发测试中,它达到了63.8%——足以击败OpenAI的o3-mini和DeepSeek的R1,但未能超过Anthropic的Claude 3.7 Sonnet,后者得分70.3%。
还有Humanity's Last Exam,这是一个包含数学、人文学科和科学等数千道题目的复杂多模态测试。Gemini 2.5 Pro取得了18.8%的成绩,优于大多数知名模型。
一经推出,Gemini 2.5 Pro就具备100万个令牌的上下文窗口——这就像能一口气读完整个《指环王》系列。而且很快,他们计划将其扩展到200万个令牌。
Google目前尚未公开API定价,但他们承诺将在未来几周内公布详情。
相关文章
Google I/O 2026 发布 Gmail 收件箱语音交互功能
谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
相关专题推荐
评论 (39)
0/500
Googleがまた新しいAIを発表したね。人間みたいに「考える」時間を設けるって、本当に可能なのかな?倫理的な問題も気になるし、技術が進むほど不安になることもある。でも、これで検索がもっと便利になるなら試してみたいかも😅
C'est marrant comment Google essaie de faire 'réfléchir' ses IA maintenant... Sauf que moi quand je réfléchis je mets 3h à choisir entre deux parfums de glace 😂 Vivement qu'ils améliorent la version Pro pour nos dilemmes du quotidien !
Whoa, Google’s Gemini 2.5 sounds like it’s got a brain of its own, pausing to ‘think’ before answering! 😮 Makes me wonder if it’ll outsmart us at pub quizzes soon. Cool tech, but I hope it doesn’t start overanalyzing my bad jokes.
Google's Gemini 2.5 sounds like a brainy upgrade! I wonder if it’ll outsmart my math homework. 🤓 Excited to see how it stacks up against other AI models.
Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔

周二,Google推出了Gemini 2.5,一套全新的AI模型,这些模型在给出答案前会真正“思考”片刻。就像它们在试图模仿我们人类,对吧?
领头的是Gemini 2.5 Pro Experimental,Google宣称这是他们迄今最智能的模型。这个厉害的家伙是多模态的,能像冠军一样处理推理任务。从周二开始,你可以在Google AI Studio上体验它,或者如果你每月支付20美元订阅Gemini Advanced,你可以通过Gemini应用访问它。
Google对推理功能非常重视——他们计划将其融入未来所有的AI模型中。
自从OpenAI在2024年9月发布了首个AI推理模型o1以来,科技界一直在奋力追赶。现在,Anthropic、DeepSeek、Google和xAI都在推出自己的推理模型。这些模型需要更多时间和计算能力来核查事实并思考问题,然后再给出答案。
推理技术对AI来说是个游戏规则的改变者,特别是在数学和编码方面。科技界的许多人认为,这些推理模型对AI代理——那些无需人类监督就能自主完成任务的系统——至关重要。不过,它们的成本也更高。
Google对此并不陌生——他们之前已经尝试过推理模型,比如去年12月发布的那个“思考”版本的Gemini。但Gemini 2.5?这是他们向OpenAI的“o”系列发起的重大挑战。
Google声称Gemini 2.5 Pro在多项基准测试中超越了他们的旧模型和竞争对手的一些顶级模型。他们定制了Gemini 2.5,使其在视觉上惊艳的网页应用和能够独立运行的编码项目中表现出色。
在Aider Polyglot代码编辑测试中,Gemini 2.5 Pro取得了68.6%的优异成绩,击败了OpenAI、Anthropic和DeepSeek的最佳模型。但在SWE-bench Verified软件开发测试中,它达到了63.8%——足以击败OpenAI的o3-mini和DeepSeek的R1,但未能超过Anthropic的Claude 3.7 Sonnet,后者得分70.3%。
还有Humanity's Last Exam,这是一个包含数学、人文学科和科学等数千道题目的复杂多模态测试。Gemini 2.5 Pro取得了18.8%的成绩,优于大多数知名模型。
一经推出,Gemini 2.5 Pro就具备100万个令牌的上下文窗口——这就像能一口气读完整个《指环王》系列。而且很快,他们计划将其扩展到200万个令牌。
Google目前尚未公开API定价,但他们承诺将在未来几周内公布详情。
Google I/O 2026 发布 Gmail 收件箱语音交互功能
谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
Googleがまた新しいAIを発表したね。人間みたいに「考える」時間を設けるって、本当に可能なのかな?倫理的な問題も気になるし、技術が進むほど不安になることもある。でも、これで検索がもっと便利になるなら試してみたいかも😅
C'est marrant comment Google essaie de faire 'réfléchir' ses IA maintenant... Sauf que moi quand je réfléchis je mets 3h à choisir entre deux parfums de glace 😂 Vivement qu'ils améliorent la version Pro pour nos dilemmes du quotidien !
Whoa, Google’s Gemini 2.5 sounds like it’s got a brain of its own, pausing to ‘think’ before answering! 😮 Makes me wonder if it’ll outsmart us at pub quizzes soon. Cool tech, but I hope it doesn’t start overanalyzing my bad jokes.
Google's Gemini 2.5 sounds like a brainy upgrade! I wonder if it’ll outsmart my math homework. 🤓 Excited to see how it stacks up against other AI models.
Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔





首页






