选项
首页
新闻
谷歌AI跃升内幕:Gemini 2.5思维更深、表达更智能且编码更快

谷歌AI跃升内幕:Gemini 2.5思维更深、表达更智能且编码更快

2025-06-07
182

谷歌AI跃升内幕:Gemini 2.5思维更深、表达更智能且编码更快

谷歌迈向通用人工智能助手愿景的步伐越来越近

在今年的谷歌I/O大会上,谷歌透露了对其Gemini 2.5系列的重大升级,尤其侧重于提升其在各个维度上的能力。最新版本——Gemini 2.5 Flash和Gemini 2.5 Pro——现在比以往任何时候都更加聪明和高效。这些进步使谷歌离实现其创造一个能够无缝理解上下文、规划和执行任务的通用人工智能助手的目标更近了一步。

Gemini 2.5 Pro:将智能提升到新高度

Gemini 2.5 Pro被谷歌称为迄今为止最先进的模型,拥有前所未有的百万令牌上下文窗口。这一功能使AI能够处理大量数据并在长时间对话中保持连贯性。在会议上,谷歌DeepMind首席执行官德米斯·哈萨比斯对取得的进展表示兴奋,称:“这是我们对Gemini应用的终极目标:一个个性化、主动且强大的AI。”Gemini 2.5 Pro的一项突出特点是引入了“深度思考”这一实验性的增强推理模式。“深度思考”使AI能够在给出回应之前分析多个假设,从而提高其决策能力。据哈萨比斯称,这项发展源于在AlphaGo创建过程中获得的见解,即更长的处理时间能带来更好的结果。

在基准测试中的出色表现

“深度思考”已经在具有挑战性的基准测试中展示了令人印象深刻的表现。例如,它在美国数学奥林匹克竞赛(USAMO)2025年比赛中取得了令人印象深刻的分数,并在LiveCodeBench(一个测试高级编码技能的基准)中表现出色。此外,它在MMMU上获得了84.0%的分数,该测试评估多模态理解和推理。尽管取得了这些成就,谷歌仍然保持谨慎。哈萨比斯提到团队正在进行彻底的安全评估,并从专家那里收集反馈后再广泛推出“深度思考”。目前,它通过API仅限于受信任的测试人员使用以获取反馈。

Gemini 2.5 Flash:日常使用的得力助手

除了Gemini 2.5 Pro,谷歌还推出了Gemini 2.5 Flash的增强版,旨在提高速度、效率和经济性。哈萨比斯将其描述为该系列的“工作马”,在推理、多模态、代码和长上下文的基准测试中表现出色。事实上,在LMArena排行榜上,它仅次于Gemini 2.5 Pro。更新后的Flash模型大约提高了20到30%的效率,完成任务所需的令牌数量减少。根据开发者的反馈,谷歌对该模型进行了微调,并在Google AI Studio、Vertex AI和Gemini应用中提供了预览。预计将在六月初全面投入生产。

两款模型的新功能

Gemini 2.5 Pro和Flash都获得了多项旨在增强用户交互的新功能。增加了原生音频输出,以创造更自然的对话体验,同时文本转语音功能现在支持多种声音。用户甚至可以引导语气和风格,无论是希望AI听起来戏剧化还是严肃。其他实验性语音功能包括情感对话,使AI能够识别用户声音中的情绪并作出相应反应,以及主动音频,用于过滤背景噪音。还引入了预算思维功能,使开发者能够在AI响应前控制其使用的计算能力。

向未来迈进

这些更新凸显了谷歌推动AI技术边界的承诺。正如Kavukcuoglu和Doshi在其博客文章中所指出的那样:“我们正经历着历史上一个非凡的时刻,AI正在创造一个令人惊叹的新未来。这是持续不断的进步。”凭借这些改进,谷歌无疑正在为AI助手成为我们日常生活不可或缺的伙伴铺平道路。

相关文章
Gemini聊天机器人增强图像编辑功能 Gemini聊天机器人增强图像编辑功能 谷歌的Gemini聊天机器人应用现允许用户从手机或电脑编辑AI生成和上传的图像,该公司周三在一篇博客文章中宣布。Gemini的内置图像编辑功能今日开始推出,计划在未来几周扩展到大多数国家并支持超过45种语言。这是在谷歌于三月在AI Studio测试的AI图像编辑模型之后,该模型因其具有争议性的水印移除功能而备受关注。与ChatGPT最近改进的图像编辑工具类似,Gemini的新编辑器旨在超越独立的A
谷歌发布Deep Think以提升Gemini AI性能 谷歌发布Deep Think以提升Gemini AI性能 谷歌正在推进其顶级Gemini AI模型。在2025年谷歌I/O大会上,公司于周二推出了Deep Think,这是其旗舰Gemini 2.5 Pro模型的高级推理模式。Deep Think使模型能够在回答前评估多种响应,从而提升其在特定基准测试中的表现。“Deep Think最大化了模型的能力,”谷歌DeepMind的负责人Demis Hassabis在新闻发布会上表示,DeepMind是公司的A
AI驱动的零售实验在Anthropic惨败 AI驱动的零售实验在Anthropic惨败 想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有iPad用于自助结账。(图片来源:
评论 (0)
0/200
返回顶部
OR