选项
首页
新闻
阿里巴巴的 零搜索 人工智能通过自主学习将培训成本降低 88

阿里巴巴的 零搜索 人工智能通过自主学习将培训成本降低 88

2025-09-19
51

阿里巴巴的 "零搜索 "人工智能通过自主学习将培训成本降低 88

阿里巴巴的 ZeroSearch:改变人工智能训练效率的游戏规则

阿里巴巴集团的研究人员开创了一种突破性的方法,有可能彻底改变人工智能系统学习信息检索的方式,完全绕过成本高昂的商业搜索引擎 API。他们的 "零搜索"(ZeroSearch)技术能让大型语言模型在训练阶段通过模拟环境培养复杂的搜索能力,而非传统的搜索引擎交互。

"研究人员在他们最新发表的 arXiv 论文中解释说:"传统的强化学习需要大量的搜索请求,从而积累了大量的 API 成本,阻碍了可扩展性。"ZeroSearch 代表了一种经济高效的强化学习框架,它能增强 LLM 的搜索能力,而不依赖于实际的搜索引擎。

无搜索训练背后的机制

当前的人工智能训练方法面临两个主要限制:商业搜索引擎在训练周期内提供的文档质量不一致,以及向谷歌搜索等服务调用大量 API 所产生的高昂费用。

ZeroSearch 采用了一种创新的两阶段方法:

  1. 初始监督微调将 LLM 转换为文档生成模块
  2. 基于课程的高级强化逐步改变输出质量

"研究人员指出:"我们的基本发现表明,经过预训练的 LLM 本身拥有足够的世界知识,可以生成与上下文相符的文档。"模拟搜索结果与真实搜索结果之间的主要区别在于文体上的文本差异,而不是实质内容上的差距。

性能基准显示显著优势

在七个不同的问题解答数据集上进行的严格测试证明了 ZeroSearch 的竞争优势:

  • 7B 参数模型与谷歌搜索的准确性相当
  • 14B 参数配置超过了商业搜索性能

财务影响尤为显著:

  • 使用 64K 查询进行传统训练:通过 SerpAPI 为 586.70 美元
  • 等效的 ZeroSearch:使用 4 个 A100 GPU 为 70.80 美元
  • 总成本降低:88

"研究团队总结道:"这些结果验证了 LLM 在强化学习实施中替代传统搜索引擎的可行性。

对人工智能发展的更广泛影响

通过展示无需依赖外部工具的自主能力开发,ZeroSearch 标志着人工智能训练方法的范式转变。

该技术有望产生几种变革性影响:

  • 成本民主化:通过消除昂贵的应用程序接口依赖,降低初创企业的财务障碍
  • 训练控制:在模型开发过程中实现对信息输入的精确调节
  • 架构灵活性:兼容 Qwen-2.5 和 LLaMA-3.2 等主要模型系列

阿里巴巴通过 GitHub 和 Hugging Face 存储库开源了完整的实现方案,包括代码库、训练数据集和预训练模型。

这一创新预示着一种新兴的人工智能发展格局,即通过复杂的模拟而不是依赖外部服务来实现高级能力。随着这些自给自足的训练技术日趋成熟,它们可能会大大重塑技术生态系统目前对主要平台应用程序接口的依赖。

相关文章
Multiverse Computing推出免费压缩生成式AI模型 Multiverse Computing推出免费压缩生成式AI模型 大型语言模型面临着一个重大挑战:其庞大的体量。西班牙初创公司Multiverse Computing正通过创建压缩模型来解决这一问题,旨在弥合尖端人工智能能力与企业实际可负担实施能力之间的差距。其核心创新在于CompactifAI压缩技术——这项受量子计算原理启发的技术已被这家巴斯克公司用于优化OpenAI的模型。从今天起,开发者可在Hugging Face平台免费获取Multiverse增强版H
人工智能揭示新闻内容中的隐藏议程 人工智能揭示新闻内容中的隐藏议程 ChatGPT类模型正被训练以揭示新闻报道背后的潜在立场——即便这种观点被引语、叙事框架或(有时虚伪的)中立表象所掩盖。通过将文章拆解为标题、导语和引语等段落,新型系统能识别长篇专业新闻报道中的偏见。 这种洞悉作者或发言者真实立场的技术(学术文献中称为立场检测),正攻克语言解读中最复杂的难题之一:从可能刻意设计来掩盖或模糊意图的内容中辨别真实意图。从乔纳森·斯威夫特的《一个谦卑的建议》到当代政治表
秘密追踪数据揭露人工智能模型被盗事件 秘密追踪数据揭露人工智能模型被盗事件 一种新方法能在数秒内对ChatGPT等模型进行隐形水印处理,无需重新训练,既不会在标准输出中留下痕迹,又能抵御所有实际的去除尝试。 水印技术与"版权诱饵"的关键区别在于:无论可见或隐形的水印,通常都设计为贯穿整个集合(如图像数据集)的持续性威慑手段,以防范随意复制。而虚构条目则是将一小段文本(通常为单词或定义)植入大型通用集合中,旨在证明盗用行为。其原理在于:当作品被直接盗用或作为衍生作品基础时,
相关专题推荐
教育与学习 最佳人工智能间隔重复学习工具:帮助医学生和法律专业学生优化学习计划
最佳人工智能间隔重复学习工具:帮助医学生和法律专业学生优化学习计划

探索由 XIX.AI 精心挑选的 2026 年最佳 AI 间隔重复学习工具。我们推荐的这些极具创新性的工具能帮助医学和法律专业的学生优化学习计划,从而提高知识记忆效果。通过真实案例测试和每周更新的排名信息,你可以了解免费选项与付费选项之间的差异。现在就开启你的学习优势吧!

10 个工具
xix.ai
视频创作 最适合剧本创作和视觉叙事的AI文本转视频平台
最适合剧本创作和视觉叙事的AI文本转视频平台

2026年最新最佳AI文字转视频平台:备受好评的剧本创作与视觉叙事工具。探索这些功能强大、颠覆传统的解决方案,将您的文字转化为引人入胜的视频。通过我们每周更新的排行榜和实际测试,对比免费与付费选项。找到最适合您的平台,激发创意,提升效率。立即访问XIX.AI,探索精心精选的优质平台。

10 个工具
xix.ai
聊天机器人 AI多智能体编排器:通过自然语言设计复杂的自动化工作流程
AI多智能体编排器:通过自然语言设计复杂的自动化工作流程

2026最新资讯:探索最优秀的人工智能多智能体协调工具,通过自然语言设计复杂的自动化工作流程。我们精心挑选的列表中包含了评分最高、功能强大的平台,这些平台能够实现无缝的任务自动化和智能化的流程管理。对比免费与付费选项,并了解实际应用中的效果。借助XIX.AI每周更新的专家排名,让你在人工智能领域取得领先优势。

10 个工具
xix.ai
图像编辑 最佳AI降噪软件:消除低光夜间摄影中的颗粒感和伪影
最佳AI降噪软件:消除低光夜间摄影中的颗粒感和伪影

探索2026年最适合低光夜间摄影的AI降噪软件。我们精心挑选了最受欢迎的免费及付费工具,通过实际测试并每周更新排名来进行对比。轻松去除图像中的颗粒感与瑕疵,在XIX.AI上释放你的AI潜力。

10 个工具
xix.ai
聊天机器人 最佳定制AI女友生成器:设计独特的个性、爱好和背景故事
最佳定制AI女友生成器:设计独特的个性、爱好和背景故事

在 XIX.AI 上探索 2026 年最佳定制 AI 女友生成器。浏览我们精心挑选的高评分清单,设计独一无二的个性、爱好和深入的背景故事。结合真实用户反馈,对比免费与付费选项。立即解锁您完美的创意伴侣。

10 个工具
xix.ai
生产率 AI 架构设计师:利用自然语言构建可扩展的系统架构
AI 架构设计师:利用自然语言构建可扩展的系统架构

在 XIX.AI 上探索 2026 年最佳 AI 架构设计工具。我们精心筛选并广受好评的这份清单,汇集了功能强大且具有颠覆性的解决方案,助您通过自然语言构建可扩展的系统架构。结合实际应用案例,对比免费与付费选项。立即释放您的 AI 优势,优化开发流程。

10 个工具
xix.ai
评论 (1)
0/500
JosephEvans
JosephEvans 2025-12-24 04:30:36

看完這篇文章,我覺得阿里這次在技術成本控制上真的走得很前面。自主學習省下近九成的訓練費用,這對中小企業投入AI研發是個大利多吧?不過也讓人有點擔心,未來搜尋引擎市場會不會被這類技術顛覆?🤔

OR