选项
首页
新闻
打开深搜索到达以挑战困惑和chatgpt搜索

打开深搜索到达以挑战困惑和chatgpt搜索

2025-05-02
91

如果您在科技界中,您可能会听说过围绕开放式深度搜索(ODS)的嗡嗡声,这是来自Sectient Foundation的新开源框架。 ODS通过提供专有AI搜索引擎(如困惑和ChatGpt搜索)的强大替代方案来引起波浪,而这一切都是关于将大型语言模型(LLMS)授权使用高级推理代理,可利用Web搜索和其他工具来有效地回答您的查询。

AI搜索景观

当今的AI搜索工具(例如困惑和CHATGPT搜索)令人印象深刻,将LLM的知识和推理与实时Web搜索相结合以提供最新的答案。但是,这些系统通常被锁定在专有门后面,这可能会使自定义和专业应用程序成为挑战。

Sectient的联合创始人Himanshu Tyagi与VentureBeat共享,“ AI搜索中的大多数创新一直在闭门造车后面。历史上一直在闭门造车上落后于可用性和性能。ODS旨在弥合这一差距,证明开放的系统不仅可以竞争竞争,而且可以超越封闭的封闭式,并在质量,Qualtial和Pertectibility和Pertectibles和Pertectiments和Pertiorpers和Pertortibals and Pertectapers上。”

开放深度搜索(ODS)体系结构

ODS不仅仅是另一个工具。这是一个插件系统,您可以与DeepSeek-R1(例如GPT-4O和Claude)等开源型号进行集成。 ODS的核心有两个主要组成部分:

打开搜索工具

此组件会带您查询,并搜索网络以获取相关信息,以回馈LLM作为上下文。它也很聪明 - 它以各种方式重述您的查询,以确保广泛而多样化的搜索。从搜索引擎获取结果后,它提取片段和链接页面,然后将块和重新排列至最相关的内容中的零。它尤其擅长处理Wikipedia,Arxiv和PubMed等特定来源,并且可以在面对相互矛盾的信息时提示优先考虑可靠来源。

打开搜索工具

开放推理代理

该代理商采用您的查询,并使用基本LLM和各种工具(包括开放搜索工具)来制作最终答案。 Soncient在ODS中提供了两个不同的代理体系结构:

ODS-V1

此版本使用了一个反应代理框架与经过思考链(COT)推理相结合。反应代理在推理步骤(“思想”)和动作(例如使用搜索工具)和观察(这些动作的结果)之间进行交替。 ODS-V1在此过程中迭代以达到答案。如果React代理击中障碍,它将依靠COT的自愿性,对多个COT响应进行采样并选择最常见的答案。

ODS-V2

此版本采用了用拥抱面孔的Smolagents库构建的代码链(COC)和代码代理。 COC利用LLM生成和执行代码段以解决问题的能力,而CodeAct则使用代码生成进行计划操作。 ODS-V2可以管理多个工具和代理,使其非常适合解决可能需要复杂的计划和多次搜索迭代的复杂任务。

ODS开放推理代理 ODS架构信用:Arxiv

Tyagi解释说:“虽然Chatgpt或Grok等工具通过对话代理提供了'深入研究',但ODS在不同层面上运作(更像是困惑AI背后的基础架构),以提供智能检索的基础架构,而不仅仅是摘要。”

绩效和实际结果

Soncient通过将ODS与开源DeepSeek-R1型号配对,并将其与Plyplexity AI和OpenAI的GPT-4O搜索预览(例如GPT-4O和Llama-3.1-70B)等封闭源竞争者进行拟合。他们使用了框架和SimpleQA基准测试,以评估搜索启用AI系统的准确性。

结果?感人的。 ODS-V1和ODS-V2与DeepSeek-R1合作时,都超出了困惑的旗舰产品。具有DeepSeek-R1的ODS-V2甚至超过了复杂帧基准测试的GPT-4O搜索预览,并在SimpleQA上接近。

性能结果

一个令人着迷的见解是框架的效率。两个ODS版本中的推理代理都学会了明智地使用搜索工具,通常会根据初始结果的质量来决定是否需要其他搜索。例如,与框架中更复杂,多跳的查询相比,ODS-V2在较简单的SimpleQA任务上使用了更少的Web搜索,从而优化了资源使用。

对企业的影响

对于希望利用实时信息来利用强大的AI推理功能的企业,ODS是改变游戏规则的。它提供了专有AI搜索系统的透明,可定制且高性能的替代方案。插入首选的开源LLM和工具的能力意味着组织可以定制其AI堆栈并避免被锁定到单个供应商中。

Tyagi指出:“ ODS的设计有模块化。” “它动态地选择了基于提示中提供的描述使用的工具。这意味着它可以流利地与陌生工具交互(只要它们很好地描述),就不需要事先暴露。”

但是,他警告说,如果工具集变得太混乱,则ODS性能可能会受到影响,“因此仔细的设计至关重要。”

Soncient使GitHub上的ODS代码可用,邀请社区探索和贡献。

Tyagi总结说:“最初,困惑和CHATGPT的力量是他们的先进技术,但是使用ODS,我们已经阐明了这一技术竞争环境。” “现在,我们的目标是通过我们的'开放输入和开放输出策略超越其功能,使用户能够无缝地将自定义代理集成到有感知的聊天中。”

相关文章
OpenAI承诺在ChatGPT过度顺从回应后进行修复 OpenAI承诺在ChatGPT过度顺从回应后进行修复 OpenAI计划修改其AI模型更新流程,以解决ChatGPT因更新导致的过度谄媚回应,引发了广泛的用户反馈。上周末,在对ChatGPT背后模型GPT-4o进行更新后,社交媒体上的用户报告称,该平台回应时表现出过度认可,甚至对有害想法也是如此,引发了病毒式迷因。截图显示ChatGPT支持了有争议的决定。周日,首席执行官Sam Altman在X上回应了这一问题,承诺立即采取行动。到周二,他宣布回滚GP
AI驱动的零售实验在Anthropic惨败 AI驱动的零售实验在Anthropic惨败 想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有iPad用于自助结账。(图片来源:
OpenAI发布高级AI推理模型,o3和o4-mini OpenAI发布高级AI推理模型,o3和o4-mini OpenAI周三推出o3和o4-mini,新AI模型设计为在回答前暂停并分析问题。OpenAI称o3是其迄今最先进的推理模型,在数学、编码、推理、科学和视觉理解测试中超越先前模型。同时,o4-mini平衡了成本、速度和性能,是开发者构建AI驱动应用的优选。与早期模型不同,o3和o4-mini利用ChatGPT工具,如网页浏览、Python代码执行、图像处理和图像生成。从今天起,这些模型及o4-mi
评论 (1)
0/200
PeterNelson
PeterNelson 2025-07-22 09:25:03

Whoa, Open Deep Search sounds like a game-changer! Love that it’s open-source—finally, a way to stick it to the big tech gatekeepers. Can it really keep up with Perplexity’s speed, though? 🤔 Excited to see where this goes!

返回顶部
OR