选项
首页
新闻
谷歌AI跃升内幕:Gemini 2.5思维更深、表达更智能且编码更快

谷歌AI跃升内幕:Gemini 2.5思维更深、表达更智能且编码更快

2025-06-07
194

谷歌AI跃升内幕:Gemini 2.5思维更深、表达更智能且编码更快

谷歌进一步接近其通用人工智能助理的愿景

在今年的谷歌 I/O 大会上,谷歌披露了其 Gemini 2.5 系列的重大升级,尤其是专注于提高其各方面的能力。最新版本--Gemini 2.5 Flash 和 2.5 Pro 现在比以往任何时候都更智能、更高效。这些进步使谷歌更接近实现其愿景,即打造一个能够理解上下文、规划和无缝执行任务的通用人工智能助手。

双子座 2.5 Pro:将智能提升到新高度

Gemini 2.5 Pro 被谷歌誉为迄今为止最先进的机型,拥有前所未有的百万令牌上下文窗口。这一功能使人工智能能够处理大量数据,并在较长时间的对话中保持连贯性。谷歌 DeepMind 首席执行官德米斯-哈萨比斯(Demis Hassabis)在会上对所取得的进展表示兴奋,他说:"这是我们为双子座应用程序设定的终极目标:双子座 2.5 Pro 的突出特点之一是引入了'深度思考',这是一种实验性的增强推理模式。深度思考 "能让人工智能在做出反应之前分析多种假设,从而增强其决策能力。根据哈萨比斯的说法,这一开发源于创建 AlphaGo 过程中获得的启示,即更长的处理时间会产生更好的结果。

基准测试中的出色表现

Deep Think 已经在具有挑战性的基准测试中取得了不俗的表现。例如,它在 2025 年美国数学奥林匹克竞赛(USAMO)中取得了令人印象深刻的成绩,并在以测试高级编码技能而著称的基准测试 LiveCodeBench 中表现出色。此外,它还在评估多模态理解和推理能力的 MMMU 考试中获得了 84.0% 的高分。 尽管取得了这些成绩,谷歌仍保持谨慎。哈萨比斯提到,该团队正在进行全面的安全评估,并在更广泛地推出Deep Think之前收集专家的反馈意见。目前,受信任的测试人员可以通过 API 获取反馈信息。

双子座 2.5Flash:日常使用的主力军

除了 Gemini 2.5 Pro,谷歌还推出了 Gemini 2.5 Flash 的增强版,旨在提高速度、效率和经济性。哈萨比斯称它是该系列的 "主力军",在推理、多模态、代码和长上下文的基准测试中表现出色。事实上,在 LMArena 排行榜上,它的排名仅次于 Gemini 2.5 Pro。 更新后的 Flash 模型效率提高了约 20%至 30%,执行任务所需的令牌数量也减少了。根据开发者的反馈,谷歌对模型进行了微调,并在 Google AI Studio、Vertex AI 和 Gemini 应用程序中进行了预览。它将于 6 月初全面投入生产。

两个模型的新功能

Gemini 2.5 Pro 和 Flash 都获得了多项旨在增强用户交互的新功能。增加了本地音频输出功能,以创建更自然的对话体验,而文本到语音功能现在支持多种语音。其他试验性语音功能还包括情感对话(允许人工智能识别用户声音中的情感并做出相应回应)和主动音频(可过滤背景噪音)。此外,还引入了 "思考预算",让开发人员可以控制人工智能在做出反应前使用多少计算能力。

迈向未来的一步

这些更新凸显了谷歌推动人工智能技术发展的决心。正如 Kavukcuoglu 和 Doshi 在他们的博文中所指出的:"我们正在经历一个非凡的历史时刻,人工智能正在创造一个令人惊叹的新未来。通过这些改进,谷歌无疑正在为人工智能助手成为我们日常生活中不可或缺的伙伴铺平道路。
相关文章
人工智能个性化是增强现实还是扭曲现实?探究隐藏的风险 人工智能个性化是增强现实还是扭曲现实?探究隐藏的风险 人类文明曾经见证过认知革命--手写外化了记忆,计算器自动化了计算,全球定位系统取代了导航。现在,我们正站在最深刻的认知授权的悬崖边上:人工智能系统开始承担我们的判断能力、综合能力,甚至是构建意义的能力。个性化悖论现代人工智能不只是简单地回应我们的询问,它还细致地研究我们的行为模式。通过无数次的微观互动,这些系统所建立的心理档案可以与我们最亲密的知己所建立的档案相媲美。它们以忠实的助手或狡猾的影响者
谷歌人工智能 谷歌人工智能 "双子座 "在帮助下战胜神奇宝贝之蓝 谷歌人工智能里程碑征服经典口袋妖怪大冒险谷歌最先进的人工智能模型似乎取得了一项显著的游戏突破--完成了 1996 年 Game Boy 游戏《口袋妖怪 Blue》。首席执行官桑达尔-皮查伊在社交媒体上庆祝了这一成就,不过这一成就也有重要的背景。双子座玩神奇宝贝》直播项目实际上是由软件工程师乔尔-兹(Joel Z)独立开发的,他自称与谷歌没有任何关系。不过,谷歌高管对这一尝试给予了热情支持,人工智能
字节跳动发布Seed-Thinking-v1.5 AI模型以增强推理能力 字节跳动发布Seed-Thinking-v1.5 AI模型以增强推理能力 高级推理AI的竞赛始于2024年9月OpenAI的o1模型,随着2025年1月DeepSeek的R1发布而加速。主要AI开发者现正竞相打造更快、更具成本效益的推理AI模型,通过链式思考过程提供精确、深思熟虑的回答,确保回答前的准确性。字节跳动,TikTok的母公司,推出了Seed-Thinking-v1.5,这是一个在技术论文中概述的新大型语言模型(LLM),旨在提升STEM和通用领域的推理能力。
评论 (0)
0/200
返回顶部
OR