打开深搜索到达以挑战困惑和chatgpt搜索
如果你身处科技领域,你可能已经听说过围绕开源深度搜索(ODS)的热议,这是Sentient基金会推出的一种新型开源框架。ODS通过提供一个强大的替代方案,对抗像Perplexity和ChatGPT搜索这样的专有AI搜索引擎,掀起了波澜。它致力于通过高级推理代理增强大型语言模型(LLMs),利用网络搜索和其他工具有效回答你的查询。
AI搜索格局
当今的AI搜索工具,如Perplexity和ChatGPT搜索,令人印象深刻,它们结合了LLMs的知识和推理能力以及实时网络搜索,提供最新的答案。然而,这些系统往往被封闭在专有的大门后,这使得定制化和专业化应用成为一大挑战。
Sentient的联合创始人Himanshu Tyagi在接受VentureBeat采访时表示:“AI搜索的大多数创新都在闭门造车。开源努力在可用性和性能上历来落后。ODS旨在弥补这一差距,证明开源系统不仅可以竞争,甚至可能在质量、速度和灵活性上超越封闭的对手。”
开源深度搜索(ODS)架构
ODS不仅仅是另一种工具;它是一个即插即用的系统,可以与像DeepSeek-R1这样的开源模型以及像GPT-4o和Claude这样的封闭模型集成。ODS的核心有两个主要组成部分:
开放搜索工具
这个组件接收你的查询并在网络上搜索相关信息,作为上下文反馈给LLM。它也很智能——会以多种方式重新表述你的查询,以确保广泛而多样的搜索。在从搜索引擎获取结果后,它会提取片段和链接页面,然后通过分块和重新排序锁定最相关的内容。它特别擅长处理像Wikipedia、ArXiv和PubMed这样的特定来源,并且可以在面对冲突信息时被提示优先选择可靠来源。

开放推理代理
这个代理接收你的查询,并使用基础LLM和各种工具(包括开放搜索工具)来构建最终答案。Sentient在ODS中提供了两种不同的代理架构:
ODS-v1
这个版本使用ReAct代理框架结合链式思考(CoT)推理。ReAct代理在推理步骤(“思考”)、行动(如使用搜索工具)和观察(这些行动的结果)之间交替进行。ODS-v1通过这一过程迭代以得出答案。如果ReAct代理遇到障碍,它会回退到CoT自一致性,采样多个CoT响应并选择最常见的答案。
ODS-v2
这个版本采用链式代码(CoC)和使用Hugging Face SmolAgents库构建的CodeAct代理。CoC利用LLM生成和执行代码片段来解决问题的能力,而CodeAct使用代码生成来规划行动。ODS-v2可以管理多个工具和代理,非常适合处理可能需要复杂规划和多次搜索迭代的复杂任务。
ODS架构来源:arXiv
Tyagi解释说:“虽然像ChatGPT或Grok这样的工具通过对话代理提供‘深度研究’,但ODS在不同层面运作——更像是Perplexity AI背后的基础设施——提供支持智能检索的基础架构,而不仅仅是摘要。”
性能与实际结果
Sentient通过将ODS与开源DeepSeek-R1模型配对,并与像Perplexity AI和OpenAI的GPT-4o搜索预览版这样的闭源竞争对手以及像GPT-4o和Llama-3.1-70B这样的独立LLMs进行对比,进行了测试。他们使用了FRAMES和SimpleQA基准,调整后用于评估启用搜索的AI系统的准确性。
结果如何?令人印象深刻。ODS-v1和ODS-v2与DeepSeek-R1配对时,均超越了Perplexity的旗舰产品。ODS-v2与DeepSeek-R1在复杂的FRAMES基准上甚至超过了GPT-4o搜索预览版,并且在SimpleQA上表现接近。

一个有趣的见解是该框架的效率。ODS两个版本的推理代理学会了明智地使用搜索工具,通常根据初始结果的质量决定是否需要再次搜索。例如,ODS-v2在较简单的SimpleQA任务上使用的网络搜索比在FRAMES中更复杂的多跳查询少,优化了资源使用。
对企业的影响
对于希望利用强大AI推理能力和实时信息的企业来说,ODS是一个改变游戏规则的工具。它提供了一个透明、可定制且高性能的替代专有AI搜索系统。能够插入首选的开源LLMs和工具意味着组织可以定制自己的AI技术栈,避免被锁定在单一供应商中。
Tyagi指出:“ODS在设计时考虑了模块化。它根据提示中提供的描述动态选择使用哪些工具。这意味着只要工具描述良好,它就可以流畅地与不熟悉的工具交互,而无需事先接触。”
然而,他警告说,如果工具集过于杂乱,ODS的性能可能会下降,“因此谨慎的设计至关重要。”
Sentient已在GitHub上公开了ODS代码,邀请社区探索和贡献。
Tyagi总结道:“最初,Perplexity和ChatGPT的实力在于其先进技术,但有了ODS,我们已经平衡了这一技术领域。我们现在通过‘开放输入和开放输出’策略,旨在超越它们的能力,使用户能够无缝地将自定义代理集成到Sentient Chat中。”
相关文章
OpenAI 与 Yubico 合作,通过加强账户保护来提升 ChatGPT 的安全性
OpenAI 正采取重大举措来加强账户安全。周四,该公司推出了“高级账户安全”功能,这是一套面向 ChatGPT 用户的可选防护措施。虽然这些功能是为知名人士设计的,但任何寻求更强安全保障的用户均可使用。作为该计划的一部分,数字安全公司 Yubico 宣布与 OpenAI 建立合作伙伴关系,将两款新型安全密钥产品集成到 ChatGPT 账户中。此次合作旨在保护用户免受针对聊天机器人平台的日益加剧的
OpenAI 推出支持银行账户对接的个人理财版 ChatGPT
上周五,OpenAI面向美国地区的ChatGPT Pro订阅用户推出了全新个人理财工具套件的预览版。该功能允许用户关联其金融账户,并就从消费分析到长期财务规划等各类问题进行咨询。为了管理这些连接,OpenAI 与金融数据网络 Plaid 展开了合作。用户可以关联来自 12,000 多家金融机构的账户,包括嘉信理财(Charles Schwab)、富达(Fidelity)、摩根大通(Chase)、R
OpenAI宣称在解决这一存在数十年的数学难题方面取得了真正的突破
OpenAI声称,其最新的推理模型生成了一个原创的数学证明,推翻了保罗·埃尔德什于1946年首次提出的著名几何学未解猜想。若这听起来似曾相识,那是因为OpenAI此前曾做出过类似的大胆宣称。七个月前,该公司前副总裁凯文·韦尔(Kevin Weil)在X平台发文称:“GPT-5找到了10个(!)此前未解的埃尔德什问题的解法,并在另外11个问题上取得了进展。”事实证明,GPT-5并未真正解决这些问题;
相关专题推荐
评论 (2)
0/500
¿ODS realmente puede competir con los gigantes? Me encanta la idea de código abierto, pero ¿será lo suficientemente rápido y preciso para el uso diario? 🤔 Espero que no sea solo otro proyecto prometedor que se queda en el camino. ¡Cruzo los dedos!
如果你身处科技领域,你可能已经听说过围绕开源深度搜索(ODS)的热议,这是Sentient基金会推出的一种新型开源框架。ODS通过提供一个强大的替代方案,对抗像Perplexity和ChatGPT搜索这样的专有AI搜索引擎,掀起了波澜。它致力于通过高级推理代理增强大型语言模型(LLMs),利用网络搜索和其他工具有效回答你的查询。
AI搜索格局
当今的AI搜索工具,如Perplexity和ChatGPT搜索,令人印象深刻,它们结合了LLMs的知识和推理能力以及实时网络搜索,提供最新的答案。然而,这些系统往往被封闭在专有的大门后,这使得定制化和专业化应用成为一大挑战。
Sentient的联合创始人Himanshu Tyagi在接受VentureBeat采访时表示:“AI搜索的大多数创新都在闭门造车。开源努力在可用性和性能上历来落后。ODS旨在弥补这一差距,证明开源系统不仅可以竞争,甚至可能在质量、速度和灵活性上超越封闭的对手。”
开源深度搜索(ODS)架构
ODS不仅仅是另一种工具;它是一个即插即用的系统,可以与像DeepSeek-R1这样的开源模型以及像GPT-4o和Claude这样的封闭模型集成。ODS的核心有两个主要组成部分:
开放搜索工具
这个组件接收你的查询并在网络上搜索相关信息,作为上下文反馈给LLM。它也很智能——会以多种方式重新表述你的查询,以确保广泛而多样的搜索。在从搜索引擎获取结果后,它会提取片段和链接页面,然后通过分块和重新排序锁定最相关的内容。它特别擅长处理像Wikipedia、ArXiv和PubMed这样的特定来源,并且可以在面对冲突信息时被提示优先选择可靠来源。

开放推理代理
这个代理接收你的查询,并使用基础LLM和各种工具(包括开放搜索工具)来构建最终答案。Sentient在ODS中提供了两种不同的代理架构:
ODS-v1
这个版本使用ReAct代理框架结合链式思考(CoT)推理。ReAct代理在推理步骤(“思考”)、行动(如使用搜索工具)和观察(这些行动的结果)之间交替进行。ODS-v1通过这一过程迭代以得出答案。如果ReAct代理遇到障碍,它会回退到CoT自一致性,采样多个CoT响应并选择最常见的答案。
ODS-v2
这个版本采用链式代码(CoC)和使用Hugging Face SmolAgents库构建的CodeAct代理。CoC利用LLM生成和执行代码片段来解决问题的能力,而CodeAct使用代码生成来规划行动。ODS-v2可以管理多个工具和代理,非常适合处理可能需要复杂规划和多次搜索迭代的复杂任务。
ODS架构来源:arXiv
Tyagi解释说:“虽然像ChatGPT或Grok这样的工具通过对话代理提供‘深度研究’,但ODS在不同层面运作——更像是Perplexity AI背后的基础设施——提供支持智能检索的基础架构,而不仅仅是摘要。”
性能与实际结果
Sentient通过将ODS与开源DeepSeek-R1模型配对,并与像Perplexity AI和OpenAI的GPT-4o搜索预览版这样的闭源竞争对手以及像GPT-4o和Llama-3.1-70B这样的独立LLMs进行对比,进行了测试。他们使用了FRAMES和SimpleQA基准,调整后用于评估启用搜索的AI系统的准确性。
结果如何?令人印象深刻。ODS-v1和ODS-v2与DeepSeek-R1配对时,均超越了Perplexity的旗舰产品。ODS-v2与DeepSeek-R1在复杂的FRAMES基准上甚至超过了GPT-4o搜索预览版,并且在SimpleQA上表现接近。

一个有趣的见解是该框架的效率。ODS两个版本的推理代理学会了明智地使用搜索工具,通常根据初始结果的质量决定是否需要再次搜索。例如,ODS-v2在较简单的SimpleQA任务上使用的网络搜索比在FRAMES中更复杂的多跳查询少,优化了资源使用。
对企业的影响
对于希望利用强大AI推理能力和实时信息的企业来说,ODS是一个改变游戏规则的工具。它提供了一个透明、可定制且高性能的替代专有AI搜索系统。能够插入首选的开源LLMs和工具意味着组织可以定制自己的AI技术栈,避免被锁定在单一供应商中。
Tyagi指出:“ODS在设计时考虑了模块化。它根据提示中提供的描述动态选择使用哪些工具。这意味着只要工具描述良好,它就可以流畅地与不熟悉的工具交互,而无需事先接触。”
然而,他警告说,如果工具集过于杂乱,ODS的性能可能会下降,“因此谨慎的设计至关重要。”
Sentient已在GitHub上公开了ODS代码,邀请社区探索和贡献。
Tyagi总结道:“最初,Perplexity和ChatGPT的实力在于其先进技术,但有了ODS,我们已经平衡了这一技术领域。我们现在通过‘开放输入和开放输出’策略,旨在超越它们的能力,使用户能够无缝地将自定义代理集成到Sentient Chat中。”
OpenAI 与 Yubico 合作,通过加强账户保护来提升 ChatGPT 的安全性
OpenAI 正采取重大举措来加强账户安全。周四,该公司推出了“高级账户安全”功能,这是一套面向 ChatGPT 用户的可选防护措施。虽然这些功能是为知名人士设计的,但任何寻求更强安全保障的用户均可使用。作为该计划的一部分,数字安全公司 Yubico 宣布与 OpenAI 建立合作伙伴关系,将两款新型安全密钥产品集成到 ChatGPT 账户中。此次合作旨在保护用户免受针对聊天机器人平台的日益加剧的
OpenAI 推出支持银行账户对接的个人理财版 ChatGPT
上周五,OpenAI面向美国地区的ChatGPT Pro订阅用户推出了全新个人理财工具套件的预览版。该功能允许用户关联其金融账户,并就从消费分析到长期财务规划等各类问题进行咨询。为了管理这些连接,OpenAI 与金融数据网络 Plaid 展开了合作。用户可以关联来自 12,000 多家金融机构的账户,包括嘉信理财(Charles Schwab)、富达(Fidelity)、摩根大通(Chase)、R
OpenAI宣称在解决这一存在数十年的数学难题方面取得了真正的突破
OpenAI声称,其最新的推理模型生成了一个原创的数学证明,推翻了保罗·埃尔德什于1946年首次提出的著名几何学未解猜想。若这听起来似曾相识,那是因为OpenAI此前曾做出过类似的大胆宣称。七个月前,该公司前副总裁凯文·韦尔(Kevin Weil)在X平台发文称:“GPT-5找到了10个(!)此前未解的埃尔德什问题的解法,并在另外11个问题上取得了进展。”事实证明,GPT-5并未真正解决这些问题;
¿ODS realmente puede competir con los gigantes? Me encanta la idea de código abierto, pero ¿será lo suficientemente rápido y preciso para el uso diario? 🤔 Espero que no sea solo otro proyecto prometedor que se queda en el camino. ¡Cruzo los dedos!





首页






