阿里巴巴的 零搜索 人工智能通过自主学习将培训成本降低 88

阿里巴巴的 ZeroSearch:改变人工智能训练效率的游戏规则
阿里巴巴集团的研究人员开创了一种突破性的方法,有可能彻底改变人工智能系统学习信息检索的方式,完全绕过成本高昂的商业搜索引擎 API。他们的 "零搜索"(ZeroSearch)技术能让大型语言模型在训练阶段通过模拟环境培养复杂的搜索能力,而非传统的搜索引擎交互。
"研究人员在他们最新发表的 arXiv 论文中解释说:"传统的强化学习需要大量的搜索请求,从而积累了大量的 API 成本,阻碍了可扩展性。"ZeroSearch 代表了一种经济高效的强化学习框架,它能增强 LLM 的搜索能力,而不依赖于实际的搜索引擎。
无搜索训练背后的机制
当前的人工智能训练方法面临两个主要限制:商业搜索引擎在训练周期内提供的文档质量不一致,以及向谷歌搜索等服务调用大量 API 所产生的高昂费用。
ZeroSearch 采用了一种创新的两阶段方法:
- 初始监督微调将 LLM 转换为文档生成模块
- 基于课程的高级强化逐步改变输出质量
"研究人员指出:"我们的基本发现表明,经过预训练的 LLM 本身拥有足够的世界知识,可以生成与上下文相符的文档。"模拟搜索结果与真实搜索结果之间的主要区别在于文体上的文本差异,而不是实质内容上的差距。
性能基准显示显著优势
在七个不同的问题解答数据集上进行的严格测试证明了 ZeroSearch 的竞争优势:
- 7B 参数模型与谷歌搜索的准确性相当
- 14B 参数配置超过了商业搜索性能
财务影响尤为显著:
- 使用 64K 查询进行传统训练:通过 SerpAPI 为 586.70 美元
- 等效的 ZeroSearch:使用 4 个 A100 GPU 为 70.80 美元
- 总成本降低:88
"研究团队总结道:"这些结果验证了 LLM 在强化学习实施中替代传统搜索引擎的可行性。
对人工智能发展的更广泛影响
通过展示无需依赖外部工具的自主能力开发,ZeroSearch 标志着人工智能训练方法的范式转变。
该技术有望产生几种变革性影响:
- 成本民主化:通过消除昂贵的应用程序接口依赖,降低初创企业的财务障碍
- 训练控制:在模型开发过程中实现对信息输入的精确调节
- 架构灵活性:兼容 Qwen-2.5 和 LLaMA-3.2 等主要模型系列
阿里巴巴通过 GitHub 和 Hugging Face 存储库开源了完整的实现方案,包括代码库、训练数据集和预训练模型。
这一创新预示着一种新兴的人工智能发展格局,即通过复杂的模拟而不是依赖外部服务来实现高级能力。随着这些自给自足的训练技术日趋成熟,它们可能会大大重塑技术生态系统目前对主要平台应用程序接口的依赖。
相关文章
Multiverse Computing推出免费压缩生成式AI模型
大型语言模型面临着一个重大挑战:其庞大的体量。西班牙初创公司Multiverse Computing正通过创建压缩模型来解决这一问题,旨在弥合尖端人工智能能力与企业实际可负担实施能力之间的差距。其核心创新在于CompactifAI压缩技术——这项受量子计算原理启发的技术已被这家巴斯克公司用于优化OpenAI的模型。从今天起,开发者可在Hugging Face平台免费获取Multiverse增强版H
人工智能揭示新闻内容中的隐藏议程
ChatGPT类模型正被训练以揭示新闻报道背后的潜在立场——即便这种观点被引语、叙事框架或(有时虚伪的)中立表象所掩盖。通过将文章拆解为标题、导语和引语等段落,新型系统能识别长篇专业新闻报道中的偏见。 这种洞悉作者或发言者真实立场的技术(学术文献中称为立场检测),正攻克语言解读中最复杂的难题之一:从可能刻意设计来掩盖或模糊意图的内容中辨别真实意图。从乔纳森·斯威夫特的《一个谦卑的建议》到当代政治表
秘密追踪数据揭露人工智能模型被盗事件
一种新方法能在数秒内对ChatGPT等模型进行隐形水印处理,无需重新训练,既不会在标准输出中留下痕迹,又能抵御所有实际的去除尝试。 水印技术与"版权诱饵"的关键区别在于:无论可见或隐形的水印,通常都设计为贯穿整个集合(如图像数据集)的持续性威慑手段,以防范随意复制。而虚构条目则是将一小段文本(通常为单词或定义)植入大型通用集合中,旨在证明盗用行为。其原理在于:当作品被直接盗用或作为衍生作品基础时,
相关专题推荐
评论 (1)
0/500

阿里巴巴的 ZeroSearch:改变人工智能训练效率的游戏规则
阿里巴巴集团的研究人员开创了一种突破性的方法,有可能彻底改变人工智能系统学习信息检索的方式,完全绕过成本高昂的商业搜索引擎 API。他们的 "零搜索"(ZeroSearch)技术能让大型语言模型在训练阶段通过模拟环境培养复杂的搜索能力,而非传统的搜索引擎交互。
"研究人员在他们最新发表的 arXiv 论文中解释说:"传统的强化学习需要大量的搜索请求,从而积累了大量的 API 成本,阻碍了可扩展性。"ZeroSearch 代表了一种经济高效的强化学习框架,它能增强 LLM 的搜索能力,而不依赖于实际的搜索引擎。
无搜索训练背后的机制
当前的人工智能训练方法面临两个主要限制:商业搜索引擎在训练周期内提供的文档质量不一致,以及向谷歌搜索等服务调用大量 API 所产生的高昂费用。
ZeroSearch 采用了一种创新的两阶段方法:
- 初始监督微调将 LLM 转换为文档生成模块
- 基于课程的高级强化逐步改变输出质量
"研究人员指出:"我们的基本发现表明,经过预训练的 LLM 本身拥有足够的世界知识,可以生成与上下文相符的文档。"模拟搜索结果与真实搜索结果之间的主要区别在于文体上的文本差异,而不是实质内容上的差距。
性能基准显示显著优势
在七个不同的问题解答数据集上进行的严格测试证明了 ZeroSearch 的竞争优势:
- 7B 参数模型与谷歌搜索的准确性相当
- 14B 参数配置超过了商业搜索性能
财务影响尤为显著:
- 使用 64K 查询进行传统训练:通过 SerpAPI 为 586.70 美元
- 等效的 ZeroSearch:使用 4 个 A100 GPU 为 70.80 美元
- 总成本降低:88
"研究团队总结道:"这些结果验证了 LLM 在强化学习实施中替代传统搜索引擎的可行性。
对人工智能发展的更广泛影响
通过展示无需依赖外部工具的自主能力开发,ZeroSearch 标志着人工智能训练方法的范式转变。
该技术有望产生几种变革性影响:
- 成本民主化:通过消除昂贵的应用程序接口依赖,降低初创企业的财务障碍
- 训练控制:在模型开发过程中实现对信息输入的精确调节
- 架构灵活性:兼容 Qwen-2.5 和 LLaMA-3.2 等主要模型系列
阿里巴巴通过 GitHub 和 Hugging Face 存储库开源了完整的实现方案,包括代码库、训练数据集和预训练模型。
这一创新预示着一种新兴的人工智能发展格局,即通过复杂的模拟而不是依赖外部服务来实现高级能力。随着这些自给自足的训练技术日趋成熟,它们可能会大大重塑技术生态系统目前对主要平台应用程序接口的依赖。
Multiverse Computing推出免费压缩生成式AI模型
大型语言模型面临着一个重大挑战:其庞大的体量。西班牙初创公司Multiverse Computing正通过创建压缩模型来解决这一问题,旨在弥合尖端人工智能能力与企业实际可负担实施能力之间的差距。其核心创新在于CompactifAI压缩技术——这项受量子计算原理启发的技术已被这家巴斯克公司用于优化OpenAI的模型。从今天起,开发者可在Hugging Face平台免费获取Multiverse增强版H
人工智能揭示新闻内容中的隐藏议程
ChatGPT类模型正被训练以揭示新闻报道背后的潜在立场——即便这种观点被引语、叙事框架或(有时虚伪的)中立表象所掩盖。通过将文章拆解为标题、导语和引语等段落,新型系统能识别长篇专业新闻报道中的偏见。 这种洞悉作者或发言者真实立场的技术(学术文献中称为立场检测),正攻克语言解读中最复杂的难题之一:从可能刻意设计来掩盖或模糊意图的内容中辨别真实意图。从乔纳森·斯威夫特的《一个谦卑的建议》到当代政治表
秘密追踪数据揭露人工智能模型被盗事件
一种新方法能在数秒内对ChatGPT等模型进行隐形水印处理,无需重新训练,既不会在标准输出中留下痕迹,又能抵御所有实际的去除尝试。 水印技术与"版权诱饵"的关键区别在于:无论可见或隐形的水印,通常都设计为贯穿整个集合(如图像数据集)的持续性威慑手段,以防范随意复制。而虚构条目则是将一小段文本(通常为单词或定义)植入大型通用集合中,旨在证明盗用行为。其原理在于:当作品被直接盗用或作为衍生作品基础时,





首页






