谷歌在 Gemini 2.5 Flash 中启用用户控制人工智能推理功能
谷歌为其 Gemini 2.5 Flash 模型提供了人工智能推理控制功能,使开发人员能够限制系统用于解决问题的处理能力。
这项 "思维预算 "于 4 月 17 日推出,旨在解决一个日益突出的行业问题:复杂的人工智能模型往往会过度思考简单的问题,从而浪费计算资源,增加运营和环境成本。
虽然这并不是一项突破性的进展,但它标志着在解决效率问题方面迈出了切实可行的一步,而随着推理功能成为商用人工智能系统的标准配置,效率问题也逐渐显现出来。
新的控制功能让开发人员可以在模型做出反应之前精确调整处理资源,从而有可能改变企业处理人工智能使用对财务和环境影响的方式。
"Gemini 公司产品管理总监 Tulsee Doshi 承认:"模型会过度思考。"对于基本的提示,模型思考得比必要的还要多。"
这种承认凸显了高级推理模型所面临的困境--基本上是用大锤来敲碎坚果。
推理能力的发展带来了意想不到的弊端。传统的大型语言模型主要依赖于从训练数据中匹配模式,而新版本则试图有条不紊地解决问题。这种循序渐进的逻辑方法能为复杂任务带来更好的结果,但却会对简单请求造成严重的低效。
平衡成本与性能
不受控制的人工智能推理会产生重大的财务影响。谷歌的技术说明显示,当启用完全推理时,生成输出结果的成本大约是标准处理成本的六倍。成本的增加为精确控制提供了强大动力。
Hugging Face 公司研究推理模型的工程师内森-哈比卜(Nathan Habib)称这是一个普遍存在的行业问题。"他告诉《麻省理工科技评论》:"在展示更智能的人工智能的竞赛中,公司把推理模型当作通用工具来使用,即使它们是不必要的。
这种浪费不仅仅是假设性的。哈比卜展示了一个顶级推理模型在试图解决一个有机化学问题时,是如何陷入重复循环,说了数百次 "等等,但是......"--实际上是在消耗处理能力的同时出现了计算崩溃。
在 DeepMind 负责评估 Gemini 模型的凯特-奥尔谢夫斯卡证实,谷歌的系统有时也会遇到类似的问题,陷入循环,耗费了计算资源,却没有提高答案质量。
细粒度控制机制
谷歌的人工智能推理控制为开发人员提供了精确的调整能力。该系统提供了一个灵活的规模,从零(最小推理)到 24,576 个 "思考预算 "代币--代表模型内部处理的计算单位。这种详细的方法可以根据具体需求定制实施方案。
DeepMind 首席研究科学家杰克-雷(Jack Rae)指出,确定理想的推理水平仍然困难重重:"要为任何特定任务定义完美的思考量,确实很有挑战性"。
发展理念的转变
人工智能推理控制的引入可能预示着人工智能发展方式的改变。自2019年以来,各家公司一直在通过创建具有更多参数和训练数据的大型模型来追求改进。谷歌的战略表明了一个不同的方向,即效率优先于纯粹的规模。
哈比卜认为:"规模法则正在被取代。"他认为,未来的进步可能来自于完善推理过程,而不是无休止地扩大模型规模。
环境后果同样重要。随着推理模型越来越普遍,其能源使用量也相应增加。研究表明,推理--产生人工智能响应--现在比初始训练阶段对技术碳足迹的贡献更大。谷歌的推理控制为这一令人担忧的趋势提供了可能的解决方案。
竞争态势
谷歌并非在真空中工作。今年早些时候出现的 "开放权重 "DeepSeek R1模型以潜在的较低成本展示了强大的推理能力,引起了市场的不稳定,据说导致了近万亿美元的股市波动。
与谷歌的专有方法不同,DeepSeek公开其内部配置,供开发者在本地运行。
尽管存在竞争,谷歌 DeepMind 的首席技术官 Koray Kavukcuoglu 认为,专有模型将在需要极高精确度的专业领域保持优势:"在编码、数学和金融等领域,人们希望模型能够高度准确、精确,并能够理解非常复杂的场景。"
行业成熟迹象
人工智能推理控制的创建反映出,该行业目前正面临着技术测量之外的实际限制。在各家公司不断推进推理能力的同时,谷歌的做法也认识到了一个重要的现实:在商业应用中,效率与原始性能同样重要。
这一特点也凸显了技术进步与可持续发展之间的矛盾。推理模型的性能跟踪器显示,单个任务的完成成本可能超过 200 美元,这引发了人们对在现实环境中大规模实施此类功能的担忧。
通过使开发人员能够根据实际需求调整推理水平,谷歌同时解决了人工智能部署的经济和环境问题。
"推理是构建智能的基本能力。"模型开始思考的那一刻,它的能动性就出现了"。这句话既抓住了推理模型的潜力,也抓住了其难点--推理模型的独立性既创造了可能性,也带来了资源管理方面的挑战。
对于实施人工智能解决方案的企业来说,微调推理预算的能力可以在保持运营效率的同时,使高级功能更易于使用。
谷歌表示,Gemini 2.5 Flash "以极小的成本和规模实现了与其他领先模型相当的性能"--这一价值主张通过针对特定用途优化推理资源的能力得到了提升。
实际意义
人工智能推理控制功能具有直接的现实用途。创建商业应用的开发人员现在可以有意识地在处理深度和运营成本之间做出选择。
对于基本客户咨询等简单应用,最小推理设置可以节省资源,同时还能充分利用模型的功能。对于需要深入理解的复杂分析,则仍可使用全部推理能力。
谷歌的推理 "表盘 "提供了一种在保持性能标准的同时实现成本可预测性的方法。
另请参见:双子座 2.5:谷歌打造迄今为止 "最智能 "的人工智能模型
想从行业领导者那里了解更多有关人工智能和大数据的信息?请参加在阿姆斯特丹、加利福尼亚和伦敦举办的人工智能与大数据博览会。这项综合性活动将与智能自动化大会(Intelligent Automation Conference)、BlockX、数字化转型周(Digital Transformation Week)和网络安全与云博览会(Cyber Security & Cloud Expo)等其他领先活动同期举行。
点击此处了解 TechForge 即将举办的其他企业技术活动和网络研讨会。
相关文章
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
Kakao Mobility 概述了面向物理人工智能的 L4 级自动驾驶路线图
Kakao Mobility 计划内部自主研发 L4 级自动驾驶技术,作为其物理人工智能战略的一部分。在首尔COEX举行的2026世界IT展上,Kakao Mobility副总裁兼物理AI部门负责人金镇奎(Kim Jin-kyu)介绍了该路线图。他的演讲聚焦于物理AI时代基于出行平台构建的自动驾驶服务。据韩联社报道,这场题为“超越构想,付诸行动:AI驱动现实”的活动汇聚了来自17个国家的460
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
相关专题推荐
评论 (1)
0/500
谷歌为其 Gemini 2.5 Flash 模型提供了人工智能推理控制功能,使开发人员能够限制系统用于解决问题的处理能力。
这项 "思维预算 "于 4 月 17 日推出,旨在解决一个日益突出的行业问题:复杂的人工智能模型往往会过度思考简单的问题,从而浪费计算资源,增加运营和环境成本。
虽然这并不是一项突破性的进展,但它标志着在解决效率问题方面迈出了切实可行的一步,而随着推理功能成为商用人工智能系统的标准配置,效率问题也逐渐显现出来。
新的控制功能让开发人员可以在模型做出反应之前精确调整处理资源,从而有可能改变企业处理人工智能使用对财务和环境影响的方式。
"Gemini 公司产品管理总监 Tulsee Doshi 承认:"模型会过度思考。"对于基本的提示,模型思考得比必要的还要多。"
这种承认凸显了高级推理模型所面临的困境--基本上是用大锤来敲碎坚果。
推理能力的发展带来了意想不到的弊端。传统的大型语言模型主要依赖于从训练数据中匹配模式,而新版本则试图有条不紊地解决问题。这种循序渐进的逻辑方法能为复杂任务带来更好的结果,但却会对简单请求造成严重的低效。
平衡成本与性能
不受控制的人工智能推理会产生重大的财务影响。谷歌的技术说明显示,当启用完全推理时,生成输出结果的成本大约是标准处理成本的六倍。成本的增加为精确控制提供了强大动力。
Hugging Face 公司研究推理模型的工程师内森-哈比卜(Nathan Habib)称这是一个普遍存在的行业问题。"他告诉《麻省理工科技评论》:"在展示更智能的人工智能的竞赛中,公司把推理模型当作通用工具来使用,即使它们是不必要的。
这种浪费不仅仅是假设性的。哈比卜展示了一个顶级推理模型在试图解决一个有机化学问题时,是如何陷入重复循环,说了数百次 "等等,但是......"--实际上是在消耗处理能力的同时出现了计算崩溃。
在 DeepMind 负责评估 Gemini 模型的凯特-奥尔谢夫斯卡证实,谷歌的系统有时也会遇到类似的问题,陷入循环,耗费了计算资源,却没有提高答案质量。
细粒度控制机制
谷歌的人工智能推理控制为开发人员提供了精确的调整能力。该系统提供了一个灵活的规模,从零(最小推理)到 24,576 个 "思考预算 "代币--代表模型内部处理的计算单位。这种详细的方法可以根据具体需求定制实施方案。
DeepMind 首席研究科学家杰克-雷(Jack Rae)指出,确定理想的推理水平仍然困难重重:"要为任何特定任务定义完美的思考量,确实很有挑战性"。
发展理念的转变
人工智能推理控制的引入可能预示着人工智能发展方式的改变。自2019年以来,各家公司一直在通过创建具有更多参数和训练数据的大型模型来追求改进。谷歌的战略表明了一个不同的方向,即效率优先于纯粹的规模。
哈比卜认为:"规模法则正在被取代。"他认为,未来的进步可能来自于完善推理过程,而不是无休止地扩大模型规模。
环境后果同样重要。随着推理模型越来越普遍,其能源使用量也相应增加。研究表明,推理--产生人工智能响应--现在比初始训练阶段对技术碳足迹的贡献更大。谷歌的推理控制为这一令人担忧的趋势提供了可能的解决方案。
竞争态势
谷歌并非在真空中工作。今年早些时候出现的 "开放权重 "DeepSeek R1模型以潜在的较低成本展示了强大的推理能力,引起了市场的不稳定,据说导致了近万亿美元的股市波动。
与谷歌的专有方法不同,DeepSeek公开其内部配置,供开发者在本地运行。
尽管存在竞争,谷歌 DeepMind 的首席技术官 Koray Kavukcuoglu 认为,专有模型将在需要极高精确度的专业领域保持优势:"在编码、数学和金融等领域,人们希望模型能够高度准确、精确,并能够理解非常复杂的场景。"
行业成熟迹象
人工智能推理控制的创建反映出,该行业目前正面临着技术测量之外的实际限制。在各家公司不断推进推理能力的同时,谷歌的做法也认识到了一个重要的现实:在商业应用中,效率与原始性能同样重要。
这一特点也凸显了技术进步与可持续发展之间的矛盾。推理模型的性能跟踪器显示,单个任务的完成成本可能超过 200 美元,这引发了人们对在现实环境中大规模实施此类功能的担忧。
通过使开发人员能够根据实际需求调整推理水平,谷歌同时解决了人工智能部署的经济和环境问题。
"推理是构建智能的基本能力。"模型开始思考的那一刻,它的能动性就出现了"。这句话既抓住了推理模型的潜力,也抓住了其难点--推理模型的独立性既创造了可能性,也带来了资源管理方面的挑战。
对于实施人工智能解决方案的企业来说,微调推理预算的能力可以在保持运营效率的同时,使高级功能更易于使用。
谷歌表示,Gemini 2.5 Flash "以极小的成本和规模实现了与其他领先模型相当的性能"--这一价值主张通过针对特定用途优化推理资源的能力得到了提升。
实际意义
人工智能推理控制功能具有直接的现实用途。创建商业应用的开发人员现在可以有意识地在处理深度和运营成本之间做出选择。
对于基本客户咨询等简单应用,最小推理设置可以节省资源,同时还能充分利用模型的功能。对于需要深入理解的复杂分析,则仍可使用全部推理能力。
谷歌的推理 "表盘 "提供了一种在保持性能标准的同时实现成本可预测性的方法。
另请参见:双子座 2.5:谷歌打造迄今为止 "最智能 "的人工智能模型
想从行业领导者那里了解更多有关人工智能和大数据的信息?请参加在阿姆斯特丹、加利福尼亚和伦敦举办的人工智能与大数据博览会。这项综合性活动将与智能自动化大会(Intelligent Automation Conference)、BlockX、数字化转型周(Digital Transformation Week)和网络安全与云博览会(Cyber Security & Cloud Expo)等其他领先活动同期举行。
点击此处了解 TechForge 即将举办的其他企业技术活动和网络研讨会。
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡





首页






