谷歌AI跃升内幕:Gemini 2.5思维更深、表达更智能且编码更快

谷歌迈向通用人工智能助手愿景的步伐越来越近
在今年的谷歌I/O大会上,谷歌透露了对其Gemini 2.5系列的重大升级,尤其侧重于提升其在各个维度上的能力。最新版本——Gemini 2.5 Flash和Gemini 2.5 Pro——现在比以往任何时候都更加聪明和高效。这些进步使谷歌离实现其创造一个能够无缝理解上下文、规划和执行任务的通用人工智能助手的目标更近了一步。
Gemini 2.5 Pro:将智能提升到新高度
Gemini 2.5 Pro被谷歌称为迄今为止最先进的模型,拥有前所未有的百万令牌上下文窗口。这一功能使AI能够处理大量数据并在长时间对话中保持连贯性。在会议上,谷歌DeepMind首席执行官德米斯·哈萨比斯对取得的进展表示兴奋,称:“这是我们对Gemini应用的终极目标:一个个性化、主动且强大的AI。”Gemini 2.5 Pro的一项突出特点是引入了“深度思考”这一实验性的增强推理模式。“深度思考”使AI能够在给出回应之前分析多个假设,从而提高其决策能力。据哈萨比斯称,这项发展源于在AlphaGo创建过程中获得的见解,即更长的处理时间能带来更好的结果。
在基准测试中的出色表现
“深度思考”已经在具有挑战性的基准测试中展示了令人印象深刻的表现。例如,它在美国数学奥林匹克竞赛(USAMO)2025年比赛中取得了令人印象深刻的分数,并在LiveCodeBench(一个测试高级编码技能的基准)中表现出色。此外,它在MMMU上获得了84.0%的分数,该测试评估多模态理解和推理。尽管取得了这些成就,谷歌仍然保持谨慎。哈萨比斯提到团队正在进行彻底的安全评估,并从专家那里收集反馈后再广泛推出“深度思考”。目前,它通过API仅限于受信任的测试人员使用以获取反馈。
Gemini 2.5 Flash:日常使用的得力助手
除了Gemini 2.5 Pro,谷歌还推出了Gemini 2.5 Flash的增强版,旨在提高速度、效率和经济性。哈萨比斯将其描述为该系列的“工作马”,在推理、多模态、代码和长上下文的基准测试中表现出色。事实上,在LMArena排行榜上,它仅次于Gemini 2.5 Pro。更新后的Flash模型大约提高了20到30%的效率,完成任务所需的令牌数量减少。根据开发者的反馈,谷歌对该模型进行了微调,并在Google AI Studio、Vertex AI和Gemini应用中提供了预览。预计将在六月初全面投入生产。
两款模型的新功能
Gemini 2.5 Pro和Flash都获得了多项旨在增强用户交互的新功能。增加了原生音频输出,以创造更自然的对话体验,同时文本转语音功能现在支持多种声音。用户甚至可以引导语气和风格,无论是希望AI听起来戏剧化还是严肃。其他实验性语音功能包括情感对话,使AI能够识别用户声音中的情绪并作出相应反应,以及主动音频,用于过滤背景噪音。还引入了预算思维功能,使开发者能够在AI响应前控制其使用的计算能力。
向未来迈进
这些更新凸显了谷歌推动AI技术边界的承诺。正如Kavukcuoglu和Doshi在其博客文章中所指出的那样:“我们正经历着历史上一个非凡的时刻,AI正在创造一个令人惊叹的新未来。这是持续不断的进步。”凭借这些改进,谷歌无疑正在为AI助手成为我们日常生活不可或缺的伙伴铺平道路。
相关文章
New open source AI company Deep Cogito releases first models and they’re already topping the charts
Deep Cogito Emerges with Revolutionary AI ModelsIn a groundbreaking move, Deep Cogito, a cutting-edge AI research startup located in San Francisco, has officially unveiled its firs
Microsoft announces over 50 AI tools to build the ‘agentic web’ at Build 2025
Microsoft Unveils Vision for the Open Agentic Web at Build ConferenceThis morning, Microsoft kicked off its annual Build conference with a bold declaration: the dawn of the "open a
Google is launching a Gemini integration in Chrome
Introducing Gemini Integration in Chrome: A New Era of AI-Powered BrowsingAt Google I/O 2025, Google made waves by announcing a groundbreaking addition to its Chrome browser—Gemini
评论 (0)
0/200
谷歌迈向通用人工智能助手愿景的步伐越来越近
在今年的谷歌I/O大会上,谷歌透露了对其Gemini 2.5系列的重大升级,尤其侧重于提升其在各个维度上的能力。最新版本——Gemini 2.5 Flash和Gemini 2.5 Pro——现在比以往任何时候都更加聪明和高效。这些进步使谷歌离实现其创造一个能够无缝理解上下文、规划和执行任务的通用人工智能助手的目标更近了一步。
Gemini 2.5 Pro:将智能提升到新高度
Gemini 2.5 Pro被谷歌称为迄今为止最先进的模型,拥有前所未有的百万令牌上下文窗口。这一功能使AI能够处理大量数据并在长时间对话中保持连贯性。在会议上,谷歌DeepMind首席执行官德米斯·哈萨比斯对取得的进展表示兴奋,称:“这是我们对Gemini应用的终极目标:一个个性化、主动且强大的AI。”Gemini 2.5 Pro的一项突出特点是引入了“深度思考”这一实验性的增强推理模式。“深度思考”使AI能够在给出回应之前分析多个假设,从而提高其决策能力。据哈萨比斯称,这项发展源于在AlphaGo创建过程中获得的见解,即更长的处理时间能带来更好的结果。
在基准测试中的出色表现
“深度思考”已经在具有挑战性的基准测试中展示了令人印象深刻的表现。例如,它在美国数学奥林匹克竞赛(USAMO)2025年比赛中取得了令人印象深刻的分数,并在LiveCodeBench(一个测试高级编码技能的基准)中表现出色。此外,它在MMMU上获得了84.0%的分数,该测试评估多模态理解和推理。尽管取得了这些成就,谷歌仍然保持谨慎。哈萨比斯提到团队正在进行彻底的安全评估,并从专家那里收集反馈后再广泛推出“深度思考”。目前,它通过API仅限于受信任的测试人员使用以获取反馈。
Gemini 2.5 Flash:日常使用的得力助手
除了Gemini 2.5 Pro,谷歌还推出了Gemini 2.5 Flash的增强版,旨在提高速度、效率和经济性。哈萨比斯将其描述为该系列的“工作马”,在推理、多模态、代码和长上下文的基准测试中表现出色。事实上,在LMArena排行榜上,它仅次于Gemini 2.5 Pro。更新后的Flash模型大约提高了20到30%的效率,完成任务所需的令牌数量减少。根据开发者的反馈,谷歌对该模型进行了微调,并在Google AI Studio、Vertex AI和Gemini应用中提供了预览。预计将在六月初全面投入生产。
两款模型的新功能
Gemini 2.5 Pro和Flash都获得了多项旨在增强用户交互的新功能。增加了原生音频输出,以创造更自然的对话体验,同时文本转语音功能现在支持多种声音。用户甚至可以引导语气和风格,无论是希望AI听起来戏剧化还是严肃。其他实验性语音功能包括情感对话,使AI能够识别用户声音中的情绪并作出相应反应,以及主动音频,用于过滤背景噪音。还引入了预算思维功能,使开发者能够在AI响应前控制其使用的计算能力。
向未来迈进
这些更新凸显了谷歌推动AI技术边界的承诺。正如Kavukcuoglu和Doshi在其博客文章中所指出的那样:“我们正经历着历史上一个非凡的时刻,AI正在创造一个令人惊叹的新未来。这是持续不断的进步。”凭借这些改进,谷歌无疑正在为AI助手成为我们日常生活不可或缺的伙伴铺平道路。












