Google启动高级AI推理模型系列

周二,Google推出了Gemini 2.5,一套全新的AI模型,这些模型在给出答案前会真正“思考”片刻。就像它们在试图模仿我们人类,对吧?
领头的是Gemini 2.5 Pro Experimental,Google宣称这是他们迄今最智能的模型。这个厉害的家伙是多模态的,能像冠军一样处理推理任务。从周二开始,你可以在Google AI Studio上体验它,或者如果你每月支付20美元订阅Gemini Advanced,你可以通过Gemini应用访问它。
Google对推理功能非常重视——他们计划将其融入未来所有的AI模型中。
自从OpenAI在2024年9月发布了首个AI推理模型o1以来,科技界一直在奋力追赶。现在,Anthropic、DeepSeek、Google和xAI都在推出自己的推理模型。这些模型需要更多时间和计算能力来核查事实并思考问题,然后再给出答案。
推理技术对AI来说是个游戏规则的改变者,特别是在数学和编码方面。科技界的许多人认为,这些推理模型对AI代理——那些无需人类监督就能自主完成任务的系统——至关重要。不过,它们的成本也更高。
Google对此并不陌生——他们之前已经尝试过推理模型,比如去年12月发布的那个“思考”版本的Gemini。但Gemini 2.5?这是他们向OpenAI的“o”系列发起的重大挑战。
Google声称Gemini 2.5 Pro在多项基准测试中超越了他们的旧模型和竞争对手的一些顶级模型。他们定制了Gemini 2.5,使其在视觉上惊艳的网页应用和能够独立运行的编码项目中表现出色。
在Aider Polyglot代码编辑测试中,Gemini 2.5 Pro取得了68.6%的优异成绩,击败了OpenAI、Anthropic和DeepSeek的最佳模型。但在SWE-bench Verified软件开发测试中,它达到了63.8%——足以击败OpenAI的o3-mini和DeepSeek的R1,但未能超过Anthropic的Claude 3.7 Sonnet,后者得分70.3%。
还有Humanity's Last Exam,这是一个包含数学、人文学科和科学等数千道题目的复杂多模态测试。Gemini 2.5 Pro取得了18.8%的成绩,优于大多数知名模型。
一经推出,Gemini 2.5 Pro就具备100万个令牌的上下文窗口——这就像能一口气读完整个《指环王》系列。而且很快,他们计划将其扩展到200万个令牌。
Google目前尚未公开API定价,但他们承诺将在未来几周内公布详情。
相关文章
谷歌发布AI驱动的Simplify工具以简化网页阅读
谷歌的iOS应用现包含“Simplify”功能,利用AI将复杂的网页文本转化为清晰易懂的内容,无需离开页面。Simplify工具由谷歌研究团队开发,使用Gemini重新措辞复杂文本,同时保留关键细节。测试显示其提升了信息的理解和记忆。通过Simplify,谷歌旨在让用户在其生态系统中处理复杂主题,减少对外部工具如OpenAI的ChatGPT的依赖。要使用Simplify,在谷歌应用中选择网页文本,
Gemini聊天机器人增强图像编辑功能
谷歌的Gemini聊天机器人应用现允许用户从手机或电脑编辑AI生成和上传的图像,该公司周三在一篇博客文章中宣布。Gemini的内置图像编辑功能今日开始推出,计划在未来几周扩展到大多数国家并支持超过45种语言。这是在谷歌于三月在AI Studio测试的AI图像编辑模型之后,该模型因其具有争议性的水印移除功能而备受关注。与ChatGPT最近改进的图像编辑工具类似,Gemini的新编辑器旨在超越独立的A
谷歌发布Deep Think以提升Gemini AI性能
谷歌正在推进其顶级Gemini AI模型。在2025年谷歌I/O大会上,公司于周二推出了Deep Think,这是其旗舰Gemini 2.5 Pro模型的高级推理模式。Deep Think使模型能够在回答前评估多种响应,从而提升其在特定基准测试中的表现。“Deep Think最大化了模型的能力,”谷歌DeepMind的负责人Demis Hassabis在新闻发布会上表示,DeepMind是公司的A
评论 (35)
0/200
RonaldMartinez
2025-04-24 12:43:27
Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔
0
RalphHill
2025-04-22 22:53:21
O Gemini 2.5 é bem legal, mas às vezes demora muito para 'pensar'. Entendo que está tentando ser mais humano, mas quando preciso de respostas rápidas, é um pouco frustrante. Ainda assim, é mais inteligente que a maioria dos AIs por aí! 🤖💭
0
HenryJackson
2025-04-20 14:08:13
ジェミニ2.5は結構クールだけど、時々「考える」のに時間がかかりすぎる。もっと人間っぽくなるのは分かるけど、早く答えが欲しい時はちょっとイライラする。でも、他のAIより賢いからね!🤖💭
0
JerryGonzález
2025-04-19 20:28:17
ジェミニ2.5、面白いですね!回答前に少し考えるのが人間っぽくて好きです。試してみたら前より賢くなってるのがわかりました。ただ、時々レスポンスが遅いのが気になりますが、深く考えるための代償だと思えば許せますね!🤔
0
ScottJohnson
2025-04-18 04:30:39
Gemini 2.5 thật tuyệt! Nó dừng lại để suy nghĩ trước khi trả lời, rất giống con người. Mình đã thử và thấy nó thông minh hơn phiên bản trước nhiều. Chỉ có điều là đôi khi nó trả lời chậm quá, nhưng mình nghĩ đó là cái giá của việc suy nghĩ sâu sắc, phải không? 🤔
0
MarkScott
2025-04-18 01:52:58
Gemini 2.5 крутой! Он действительно делает паузу, чтобы подумать, прежде чем ответить, что делает его более похожим на человека. Попробовал версию Pro Experimental, и она определенно умнее. Хотелось бы, чтобы он был быстрее! 🤔🚀
0
周二,Google推出了Gemini 2.5,一套全新的AI模型,这些模型在给出答案前会真正“思考”片刻。就像它们在试图模仿我们人类,对吧?
领头的是Gemini 2.5 Pro Experimental,Google宣称这是他们迄今最智能的模型。这个厉害的家伙是多模态的,能像冠军一样处理推理任务。从周二开始,你可以在Google AI Studio上体验它,或者如果你每月支付20美元订阅Gemini Advanced,你可以通过Gemini应用访问它。
Google对推理功能非常重视——他们计划将其融入未来所有的AI模型中。
自从OpenAI在2024年9月发布了首个AI推理模型o1以来,科技界一直在奋力追赶。现在,Anthropic、DeepSeek、Google和xAI都在推出自己的推理模型。这些模型需要更多时间和计算能力来核查事实并思考问题,然后再给出答案。
推理技术对AI来说是个游戏规则的改变者,特别是在数学和编码方面。科技界的许多人认为,这些推理模型对AI代理——那些无需人类监督就能自主完成任务的系统——至关重要。不过,它们的成本也更高。
Google对此并不陌生——他们之前已经尝试过推理模型,比如去年12月发布的那个“思考”版本的Gemini。但Gemini 2.5?这是他们向OpenAI的“o”系列发起的重大挑战。
Google声称Gemini 2.5 Pro在多项基准测试中超越了他们的旧模型和竞争对手的一些顶级模型。他们定制了Gemini 2.5,使其在视觉上惊艳的网页应用和能够独立运行的编码项目中表现出色。
在Aider Polyglot代码编辑测试中,Gemini 2.5 Pro取得了68.6%的优异成绩,击败了OpenAI、Anthropic和DeepSeek的最佳模型。但在SWE-bench Verified软件开发测试中,它达到了63.8%——足以击败OpenAI的o3-mini和DeepSeek的R1,但未能超过Anthropic的Claude 3.7 Sonnet,后者得分70.3%。
还有Humanity's Last Exam,这是一个包含数学、人文学科和科学等数千道题目的复杂多模态测试。Gemini 2.5 Pro取得了18.8%的成绩,优于大多数知名模型。
一经推出,Gemini 2.5 Pro就具备100万个令牌的上下文窗口——这就像能一口气读完整个《指环王》系列。而且很快,他们计划将其扩展到200万个令牌。
Google目前尚未公开API定价,但他们承诺将在未来几周内公布详情。




Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔




O Gemini 2.5 é bem legal, mas às vezes demora muito para 'pensar'. Entendo que está tentando ser mais humano, mas quando preciso de respostas rápidas, é um pouco frustrante. Ainda assim, é mais inteligente que a maioria dos AIs por aí! 🤖💭




ジェミニ2.5は結構クールだけど、時々「考える」のに時間がかかりすぎる。もっと人間っぽくなるのは分かるけど、早く答えが欲しい時はちょっとイライラする。でも、他のAIより賢いからね!🤖💭




ジェミニ2.5、面白いですね!回答前に少し考えるのが人間っぽくて好きです。試してみたら前より賢くなってるのがわかりました。ただ、時々レスポンスが遅いのが気になりますが、深く考えるための代償だと思えば許せますね!🤔




Gemini 2.5 thật tuyệt! Nó dừng lại để suy nghĩ trước khi trả lời, rất giống con người. Mình đã thử và thấy nó thông minh hơn phiên bản trước nhiều. Chỉ có điều là đôi khi nó trả lời chậm quá, nhưng mình nghĩ đó là cái giá của việc suy nghĩ sâu sắc, phải không? 🤔




Gemini 2.5 крутой! Он действительно делает паузу, чтобы подумать, прежде чем ответить, что делает его более похожим на человека. Попробовал версию Pro Experimental, и она определенно умнее. Хотелось бы, чтобы он был быстрее! 🤔🚀












