打开深搜索到达以挑战困惑和chatgpt搜索

首页

新闻

2025-05-02

SamuelThomas

# ChatGPT # Claude # gpt-4o # LLMs

如果您在科技界中，您可能会听说过围绕开放式深度搜索（ODS）的嗡嗡声，这是来自Sectient Foundation的新开源框架。 ODS通过提供专有AI搜索引擎（如困惑和ChatGpt搜索）的强大替代方案来引起波浪，而这一切都是关于将大型语言模型（LLMS）授权使用高级推理代理，可利用Web搜索和其他工具来有效地回答您的查询。

AI搜索景观

当今的AI搜索工具（例如困惑和CHATGPT搜索）令人印象深刻，将LLM的知识和推理与实时Web搜索相结合以提供最新的答案。但是，这些系统通常被锁定在专有门后面，这可能会使自定义和专业应用程序成为挑战。

Sectient的联合创始人Himanshu Tyagi与VentureBeat共享，“ AI搜索中的大多数创新一直在闭门造车后面。历史上一直在闭门造车上落后于可用性和性能。ODS旨在弥合这一差距，证明开放的系统不仅可以竞争竞争，而且可以超越封闭的封闭式，并在质量，Qualtial和Pertectibility和Pertectibles和Pertectiments和Pertiorpers和Pertortibals and Pertectapers上。”

开放深度搜索（ODS）体系结构

ODS不仅仅是另一个工具。这是一个插件系统，您可以与DeepSeek-R1（例如GPT-4O和Claude）等开源型号进行集成。 ODS的核心有两个主要组成部分：

打开搜索工具

此组件会带您查询，并搜索网络以获取相关信息，以回馈LLM作为上下文。它也很聪明 - 它以各种方式重述您的查询，以确保广泛而多样化的搜索。从搜索引擎获取结果后，它提取片段和链接页面，然后将块和重新排列至最相关的内容中的零。它尤其擅长处理Wikipedia，Arxiv和PubMed等特定来源，并且可以在面对相互矛盾的信息时提示优先考虑可靠来源。

打开搜索工具

开放推理代理

该代理商采用您的查询，并使用基本LLM和各种工具（包括开放搜索工具）来制作最终答案。 Soncient在ODS中提供了两个不同的代理体系结构：

ODS-V1

此版本使用了一个反应代理框架与经过思考链（COT）推理相结合。反应代理在推理步骤（“思想”）和动作（例如使用搜索工具）和观察（这些动作的结果）之间进行交替。 ODS-V1在此过程中迭代以达到答案。如果React代理击中障碍，它将依靠COT的自愿性，对多个COT响应进行采样并选择最常见的答案。

ODS-V2

此版本采用了用拥抱面孔的Smolagents库构建的代码链（COC）和代码代理。 COC利用LLM生成和执行代码段以解决问题的能力，而CodeAct则使用代码生成进行计划操作。 ODS-V2可以管理多个工具和代理，使其非常适合解决可能需要复杂的计划和多次搜索迭代的复杂任务。

ODS开放推理代理 ODS架构信用：Arxiv

Tyagi解释说：“虽然Chatgpt或Grok等工具通过对话代理提供了'深入研究'，但ODS在不同层面上运作（更像是困惑AI背后的基础架构），以提供智能检索的基础架构，而不仅仅是摘要。”

绩效和实际结果

Soncient通过将ODS与开源DeepSeek-R1型号配对，并将其与Plyplexity AI和OpenAI的GPT-4O搜索预览（例如GPT-4O和Llama-3.1-70B）等封闭源竞争者进行拟合。他们使用了框架和SimpleQA基准测试，以评估搜索启用AI系统的准确性。

结果？感人的。 ODS-V1和ODS-V2与DeepSeek-R1合作时，都超出了困惑的旗舰产品。具有DeepSeek-R1的ODS-V2甚至超过了复杂帧基准测试的GPT-4O搜索预览，并在SimpleQA上接近。

性能结果

一个令人着迷的见解是框架的效率。两个ODS版本中的推理代理都学会了明智地使用搜索工具，通常会根据初始结果的质量来决定是否需要其他搜索。例如，与框架中更复杂，多跳的查询相比，ODS-V2在较简单的SimpleQA任务上使用了更少的Web搜索，从而优化了资源使用。

对企业的影响

对于希望利用实时信息来利用强大的AI推理功能的企业，ODS是改变游戏规则的。它提供了专有AI搜索系统的透明，可定制且高性能的替代方案。插入首选的开源LLM和工具的能力意味着组织可以定制其AI堆栈并避免被锁定到单个供应商中。

Tyagi指出：“ ODS的设计有模块化。” “它动态地选择了基于提示中提供的描述使用的工具。这意味着它可以流利地与陌生工具交互（只要它们很好地描述），就不需要事先暴露。”

但是，他警告说，如果工具集变得太混乱，则ODS性能可能会受到影响，“因此仔细的设计至关重要。”

Soncient使GitHub上的ODS代码可用，邀请社区探索和贡献。

Tyagi总结说：“最初，困惑和CHATGPT的力量是他们的先进技术，但是使用ODS，我们已经阐明了这一技术竞争环境。” “现在，我们的目标是通过我们的'开放输入和开放输出策略超越其功能，使用户能够无缝地将自定义代理集成到有感知的聊天中。”

OpenAI承诺在ChatGPT过度顺从回应后进行修复 OpenAI计划修改其AI模型更新流程，以解决ChatGPT因更新导致的过度谄媚回应，引发了广泛的用户反馈。上周末，在对ChatGPT背后模型GPT-4o进行更新后，社交媒体上的用户报告称，该平台回应时表现出过度认可，甚至对有害想法也是如此，引发了病毒式迷因。截图显示ChatGPT支持了有争议的决定。周日，首席执行官Sam Altman在X上回应了这一问题，承诺立即采取行动。到周二，他宣布回滚GP

AI驱动的零售实验在Anthropic惨败想象将一家小商店交给人工智能，委托它处理从定价到客户互动的一切。会出什么问题？Anthropic周五发布的一项研究回答了这个问题：几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月，结果堪称商学院学生的警示案例，像是完全没有现实经验的人写的——这正是实验的实际情况。Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱，配有iPad用于自助结账。（图片来源：

OpenAI发布高级AI推理模型，o3和o4-mini OpenAI周三推出o3和o4-mini，新AI模型设计为在回答前暂停并分析问题。OpenAI称o3是其迄今最先进的推理模型，在数学、编码、推理、科学和视觉理解测试中超越先前模型。同时，o4-mini平衡了成本、速度和性能，是开发者构建AI驱动应用的优选。与早期模型不同，o3和o4-mini利用ChatGPT工具，如网页浏览、Python代码执行、图像处理和图像生成。从今天起，这些模型及o4-mi

0/200

提交

PeterNelson

2025-07-22 09:25:03

Whoa, Open Deep Search sounds like a game-changer! Love that it’s open-source—finally, a way to stick it to the big tech gatekeepers. Can it really keep up with Perplexity’s speed, though? 🤔 Excited to see where this goes!