谷歌将人工智能培训成本降低一万倍
人工智能行业存在一个基本悖论。虽然机器能以前所未有的规模处理数据,但学习过程本身的效率仍然低得出奇,经常面临收益递减的问题。传统的机器学习方法需要庞大的、精心标注的数据集,这些数据集可能需要数年时间和数百万美元才能制作完成。这些方法通常遵循的原则是,数据越多,人工智能模型越好。然而,谷歌的研究人员最近推出了一种新方法,对这一长期存在的假设提出了质疑,该方法证明,只需减少多达 10,000 倍的训练数据,就能实现与之相当的人工智能性能。这一进步有可能从根本上重塑我们的人工智能方法。本文将深入探讨谷歌团队是如何达到这一里程碑的,它对未来的潜在影响,以及未来的挑战和机遇。
人工智能的大数据挑战
几十年来,业界的人工智能战略一直受 "更多数据等于更好的人工智能 "这一口号的驱动。像 GPT-4 这样的大规模语言模型是在数万亿个文本标记的基础上训练出来的。这种数据密集型方法给那些没有大量资源或独特数据集的企业带来了巨大障碍。首先,人工标注花费巨大。专家标注员的收费很高,而且所需的数据量巨大,使项目成本过高。其次,收集到的大部分数据往往是重复性的,对学习过程没有意义。当需求发生变化时,传统方法也会出现问题。每当政策更新或出现新形式的问题内容时,公司就不得不从头开始重新启动标签流程,从而引发持续而昂贵的数据采集和模型再培训循环。
利用主动学习应对大数据挑战
解决这些数据问题的公认策略是实施主动学习。这种技术依赖于一个细致的整理过程,该过程可以找出最有价值的训练示例,供人工审核人员进行标注。其核心理念是,模型可以从它们认为最具挑战性的示例中进行最有效的学习,而不是被动地吸收每一个可用的数据点。与依赖大型数据集的传统人工智能方法相比,主动学习采取了一种更具战术性的姿态,只专注于收集信息量最大的样本。这种策略有助于避免低效地标注明显或冗余的数据,因为这些数据对模型的价值微乎其微。相反,主动学习侧重于边缘案例和不确定实例,这些案例和实例具有提高模型性能的巨大潜力。
通过将专家的精力引向这些关键实例,主动学习能让模型在数据点少得多的情况下更快速、更有效地学习。这种方法有望解决数据瓶颈和传统机器学习固有的低效率问题。
谷歌的主动学习方法
谷歌的研究团队已经成功应用了这一框架。他们新颖的主动学习技术表明,经过精心策划的高质量示例可以有效替代大量的标记数据。例如,他们的研究表明,在少于 500 个专家标签示例上训练出来的模型与在 100,000 个标准标签上训练出来的系统表现一样好,甚至有过之而无不及。
这一过程是通过谷歌所谓的 "LLM-as-Scout "系统来实现的。大型语言模型首先会筛选大量未标记的数据,标出预测结果最不确定的实例。这些边缘案例正是模型需要人工输入以完善其决策的场景。这一过程从一个初始模型开始,该模型使用简单的提示对大型数据集进行标注。然后,系统根据预测的分类对示例进行分组,并找出模型在不同类别之间出现混淆的地方。这些重叠的群组揭示了专家人工判断能够带来最大价值的确切点。
该方法特别针对非常相似但标签不同的示例对。这些边界案例正是人类专业知识最为关键的场景。通过将专家标签工作集中在这些容易混淆的示例上,系统实现了非凡的效率。
质量重于数量
这项研究揭示了一个关于数据质量的重要观点,与人工智能领域的普遍看法相悖。研究表明,专家标签具有高准确性和一致性,其性能可靠地优于大规模的众包注释。研究团队使用科恩卡帕(Cohen's Kappa)对其进行了量化,科恩卡帕是一种统计量度,用于评估模型的预测与专家共识的匹配程度,而不是随机机会产生的结果。在谷歌的测试中,专家注释者的科恩卡帕得分超过了 0.8,大大超过了众包通常达到的水平。
这种卓越的一致性使模型能够从数量更少的示例中有效地学习。在使用 Gemini Nano-1 和 Nano-2 进行的评估中,与大约 100,000 个随机众包标签相比,模型仅使用 250-450 个精心挑选的示例就达到或超过了专家对齐水平--减少了三到四个数量级。然而,它的优势不仅仅在于使用更少的数据。用这种技术训练出来的模型,其性能往往超过用传统方法训练出来的模型。对于复杂的任务和较大的模型,性能收益比基线高出 55-65%,表明与政策专家的一致性更强、更可靠。
为什么这一突破事关重大
这一发展正值人工智能行业的关键时刻。随着模型变得越来越大、越来越复杂,单纯增加训练数据的传统策略已越来越难以为继。训练庞大的模型对环境的影响不断加剧,而对于许多企业来说,进入该行业的经济壁垒仍然很高。
谷歌的方法同时应对了多个行业挑战。标签成本的大幅降低使人工智能的开发对小型组织和研究团体来说更加可行。更快的迭代周期允许快速适应不断变化的需求,这在内容管理和网络安全等快速发展的领域至关重要。
这种方法还对人工智能的安全性和可靠性产生了更广泛的影响。通过专注于模型最不确定的情况,该技术自然会发现潜在的故障点和边缘情况。这一过程会产生更强大的系统,这些系统能更好地把握自身的局限性。
对人工智能发展的更广泛影响
这一突破表明,我们可能正在进入一个人工智能发展的新时代,在这个时代,效率比规模更重要。在训练数据方面,传统的 "越大越好 "理念可能会被强调数据质量和策略选择的更精细方法所取代。
单单是对环境的影响就相当大。目前,训练大型人工智能模型需要大量的计算资源和能源。如果能用更少的数据获得类似的结果,那么人工智能发展的碳足迹就会大大减少。
民主化效应同样重要。以前无法资助大规模数据收集计划的小型研究团队和组织,现在有了开发有竞争力的人工智能系统的可行途径。这一进步可以加速创新,并为人工智能领域引入更多不同的观点。
局限性和考虑因素
尽管该方法取得了可喜的成果,但也遇到了一些实际障碍。由于需要能达到科恩 Kappa 分数 0.8 以上的专家注释者,这可能会限制其在专业知识有限或标准不明确的领域中的应用。研究主要集中在分类任务和内容安全应用方面。其他人工智能任务(如语言生成或复杂推理)是否也能实现类似的显著改进,我们拭目以待。
与传统的批量处理方法相比,主动学习的迭代性质也增加了复杂性。企业必须建立新的工作流程和基础设施,以支持持续的查询和响应循环,从而促进模型的不断完善。
未来的研究很可能会调查保持专家级注释质量和创建特定领域版本的核心技术的自动化方法。将主动学习原则与其他高效方法(如参数高效微调)相结合,可以进一步提高性能。
底线
谷歌的研究表明,有针对性的高质量数据可以超越海量数据集。通过将标注工作集中在最有价值的示例上,他们将训练数据需求减少了多达 10,000 倍,同时还提高了性能。这一战略降低了成本,加快了开发速度,减少了对环境的影响,并扩大了先进人工智能的使用范围。这是朝着更高效、更可持续的人工智能发展迈出的重要一步。
相关文章
AI搜索强制政策引发用户出走潮,DuckDuckGo用户激增
继谷歌在2026年I/O大会上宣布将对其搜索引擎进行全面的人工智能改造后,由于没有简单的“一键禁用”功能来关闭AI功能,许多用户开始寻找更具可控性的替代方案。 以隐私保护为宗旨的搜索平台DuckDuckGo近期流量出现明显转移,已成为对谷歌激进AI推广不满用户的热门避风港。1. 用户用脚投票:安装量激增根据DuckDuckGo分享的数据,随着用户对谷歌AI更新的不满情绪加剧,该平台在5月20日至2
小红书进行组织架构调整:柯南出任总裁,新设AI主营部门Dots及海外业务部门Rednote
4月30日,小红书向全体员工发布内部通告,宣布启动新一轮组织架构调整。此次调整的核心在于将社区、电商和商业化三大业务线与公司的技术系统全面整合。 公司新设了名为“Dots”的AI优先部门,这标志着小红书已正式将AI提升为最高战略优先级,旨在使其从工具性功能转变为核心生产力。在人事任命方面,南(丁玲)被任命为小红书总裁,负责公司核心业务运营,并直接向CEO邢宇汇报。 各业务板块负责人也已明确:智恒将
腾讯旗下“小龙虾”表现远超预期,团队将运力扩大10倍,并致歉及提供补偿
腾讯正式推出全场景AI智能助手“WorkBuddy”,凭借高度集成和低部署门槛,标志着大型模型应用层竞争进入新阶段。该产品在发布当天便引发了业界广泛关注。 用户流量远超预期,导致相关产品腾讯云代码助手(CodeBuddy)出现登录故障及服务不稳定。腾讯云团队随后发布致歉声明,表示技术团队已紧急将容量扩容十倍,目前服务已全面恢复。受影响用户获得了5,000腾讯云代金券作为补偿。业界观察人士将Work
相关专题推荐
评论 (2)
0/500
Also die Kosten um das 10.000-fache zu senken? Das klingt fast zu gut, um wahr zu sein. Google hat da wohl einen echten Durchbruch geschafft. Wenn das stimmt, könnte das die ganze KI-Entwicklung demokratisieren. Kleine Startups hätten dann plötzlich eine Chance. Aber ich frage mich, ob das nur für bestimmte Modelle oder Trainingsmethoden funktioniert. Die Details wären spannend! 🤔
人工智能行业存在一个基本悖论。虽然机器能以前所未有的规模处理数据,但学习过程本身的效率仍然低得出奇,经常面临收益递减的问题。传统的机器学习方法需要庞大的、精心标注的数据集,这些数据集可能需要数年时间和数百万美元才能制作完成。这些方法通常遵循的原则是,数据越多,人工智能模型越好。然而,谷歌的研究人员最近推出了一种新方法,对这一长期存在的假设提出了质疑,该方法证明,只需减少多达 10,000 倍的训练数据,就能实现与之相当的人工智能性能。这一进步有可能从根本上重塑我们的人工智能方法。本文将深入探讨谷歌团队是如何达到这一里程碑的,它对未来的潜在影响,以及未来的挑战和机遇。
人工智能的大数据挑战
几十年来,业界的人工智能战略一直受 "更多数据等于更好的人工智能 "这一口号的驱动。像 GPT-4 这样的大规模语言模型是在数万亿个文本标记的基础上训练出来的。这种数据密集型方法给那些没有大量资源或独特数据集的企业带来了巨大障碍。首先,人工标注花费巨大。专家标注员的收费很高,而且所需的数据量巨大,使项目成本过高。其次,收集到的大部分数据往往是重复性的,对学习过程没有意义。当需求发生变化时,传统方法也会出现问题。每当政策更新或出现新形式的问题内容时,公司就不得不从头开始重新启动标签流程,从而引发持续而昂贵的数据采集和模型再培训循环。
利用主动学习应对大数据挑战
解决这些数据问题的公认策略是实施主动学习。这种技术依赖于一个细致的整理过程,该过程可以找出最有价值的训练示例,供人工审核人员进行标注。其核心理念是,模型可以从它们认为最具挑战性的示例中进行最有效的学习,而不是被动地吸收每一个可用的数据点。与依赖大型数据集的传统人工智能方法相比,主动学习采取了一种更具战术性的姿态,只专注于收集信息量最大的样本。这种策略有助于避免低效地标注明显或冗余的数据,因为这些数据对模型的价值微乎其微。相反,主动学习侧重于边缘案例和不确定实例,这些案例和实例具有提高模型性能的巨大潜力。
通过将专家的精力引向这些关键实例,主动学习能让模型在数据点少得多的情况下更快速、更有效地学习。这种方法有望解决数据瓶颈和传统机器学习固有的低效率问题。
谷歌的主动学习方法
谷歌的研究团队已经成功应用了这一框架。他们新颖的主动学习技术表明,经过精心策划的高质量示例可以有效替代大量的标记数据。例如,他们的研究表明,在少于 500 个专家标签示例上训练出来的模型与在 100,000 个标准标签上训练出来的系统表现一样好,甚至有过之而无不及。
这一过程是通过谷歌所谓的 "LLM-as-Scout "系统来实现的。大型语言模型首先会筛选大量未标记的数据,标出预测结果最不确定的实例。这些边缘案例正是模型需要人工输入以完善其决策的场景。这一过程从一个初始模型开始,该模型使用简单的提示对大型数据集进行标注。然后,系统根据预测的分类对示例进行分组,并找出模型在不同类别之间出现混淆的地方。这些重叠的群组揭示了专家人工判断能够带来最大价值的确切点。
该方法特别针对非常相似但标签不同的示例对。这些边界案例正是人类专业知识最为关键的场景。通过将专家标签工作集中在这些容易混淆的示例上,系统实现了非凡的效率。
质量重于数量
这项研究揭示了一个关于数据质量的重要观点,与人工智能领域的普遍看法相悖。研究表明,专家标签具有高准确性和一致性,其性能可靠地优于大规模的众包注释。研究团队使用科恩卡帕(Cohen's Kappa)对其进行了量化,科恩卡帕是一种统计量度,用于评估模型的预测与专家共识的匹配程度,而不是随机机会产生的结果。在谷歌的测试中,专家注释者的科恩卡帕得分超过了 0.8,大大超过了众包通常达到的水平。
这种卓越的一致性使模型能够从数量更少的示例中有效地学习。在使用 Gemini Nano-1 和 Nano-2 进行的评估中,与大约 100,000 个随机众包标签相比,模型仅使用 250-450 个精心挑选的示例就达到或超过了专家对齐水平--减少了三到四个数量级。然而,它的优势不仅仅在于使用更少的数据。用这种技术训练出来的模型,其性能往往超过用传统方法训练出来的模型。对于复杂的任务和较大的模型,性能收益比基线高出 55-65%,表明与政策专家的一致性更强、更可靠。
为什么这一突破事关重大
这一发展正值人工智能行业的关键时刻。随着模型变得越来越大、越来越复杂,单纯增加训练数据的传统策略已越来越难以为继。训练庞大的模型对环境的影响不断加剧,而对于许多企业来说,进入该行业的经济壁垒仍然很高。
谷歌的方法同时应对了多个行业挑战。标签成本的大幅降低使人工智能的开发对小型组织和研究团体来说更加可行。更快的迭代周期允许快速适应不断变化的需求,这在内容管理和网络安全等快速发展的领域至关重要。
这种方法还对人工智能的安全性和可靠性产生了更广泛的影响。通过专注于模型最不确定的情况,该技术自然会发现潜在的故障点和边缘情况。这一过程会产生更强大的系统,这些系统能更好地把握自身的局限性。
对人工智能发展的更广泛影响
这一突破表明,我们可能正在进入一个人工智能发展的新时代,在这个时代,效率比规模更重要。在训练数据方面,传统的 "越大越好 "理念可能会被强调数据质量和策略选择的更精细方法所取代。
单单是对环境的影响就相当大。目前,训练大型人工智能模型需要大量的计算资源和能源。如果能用更少的数据获得类似的结果,那么人工智能发展的碳足迹就会大大减少。
民主化效应同样重要。以前无法资助大规模数据收集计划的小型研究团队和组织,现在有了开发有竞争力的人工智能系统的可行途径。这一进步可以加速创新,并为人工智能领域引入更多不同的观点。
局限性和考虑因素
尽管该方法取得了可喜的成果,但也遇到了一些实际障碍。由于需要能达到科恩 Kappa 分数 0.8 以上的专家注释者,这可能会限制其在专业知识有限或标准不明确的领域中的应用。研究主要集中在分类任务和内容安全应用方面。其他人工智能任务(如语言生成或复杂推理)是否也能实现类似的显著改进,我们拭目以待。
与传统的批量处理方法相比,主动学习的迭代性质也增加了复杂性。企业必须建立新的工作流程和基础设施,以支持持续的查询和响应循环,从而促进模型的不断完善。
未来的研究很可能会调查保持专家级注释质量和创建特定领域版本的核心技术的自动化方法。将主动学习原则与其他高效方法(如参数高效微调)相结合,可以进一步提高性能。
底线
谷歌的研究表明,有针对性的高质量数据可以超越海量数据集。通过将标注工作集中在最有价值的示例上,他们将训练数据需求减少了多达 10,000 倍,同时还提高了性能。这一战略降低了成本,加快了开发速度,减少了对环境的影响,并扩大了先进人工智能的使用范围。这是朝着更高效、更可持续的人工智能发展迈出的重要一步。
AI搜索强制政策引发用户出走潮,DuckDuckGo用户激增
继谷歌在2026年I/O大会上宣布将对其搜索引擎进行全面的人工智能改造后,由于没有简单的“一键禁用”功能来关闭AI功能,许多用户开始寻找更具可控性的替代方案。 以隐私保护为宗旨的搜索平台DuckDuckGo近期流量出现明显转移,已成为对谷歌激进AI推广不满用户的热门避风港。1. 用户用脚投票:安装量激增根据DuckDuckGo分享的数据,随着用户对谷歌AI更新的不满情绪加剧,该平台在5月20日至2
小红书进行组织架构调整:柯南出任总裁,新设AI主营部门Dots及海外业务部门Rednote
4月30日,小红书向全体员工发布内部通告,宣布启动新一轮组织架构调整。此次调整的核心在于将社区、电商和商业化三大业务线与公司的技术系统全面整合。 公司新设了名为“Dots”的AI优先部门,这标志着小红书已正式将AI提升为最高战略优先级,旨在使其从工具性功能转变为核心生产力。在人事任命方面,南(丁玲)被任命为小红书总裁,负责公司核心业务运营,并直接向CEO邢宇汇报。 各业务板块负责人也已明确:智恒将
腾讯旗下“小龙虾”表现远超预期,团队将运力扩大10倍,并致歉及提供补偿
腾讯正式推出全场景AI智能助手“WorkBuddy”,凭借高度集成和低部署门槛,标志着大型模型应用层竞争进入新阶段。该产品在发布当天便引发了业界广泛关注。 用户流量远超预期,导致相关产品腾讯云代码助手(CodeBuddy)出现登录故障及服务不稳定。腾讯云团队随后发布致歉声明,表示技术团队已紧急将容量扩容十倍,目前服务已全面恢复。受影响用户获得了5,000腾讯云代金券作为补偿。业界观察人士将Work
Also die Kosten um das 10.000-fache zu senken? Das klingt fast zu gut, um wahr zu sein. Google hat da wohl einen echten Durchbruch geschafft. Wenn das stimmt, könnte das die ganze KI-Entwicklung demokratisieren. Kleine Startups hätten dann plötzlich eine Chance. Aber ich frage mich, ob das nur für bestimmte Modelle oder Trainingsmethoden funktioniert. Die Details wären spannend! 🤔





首页






