選項
首頁
新聞
打開深搜索到達以挑戰困惑和chatgpt搜索

打開深搜索到達以挑戰困惑和chatgpt搜索

2025-05-02
91

如果您在科技界中,您可能會聽說過圍繞開放式深度搜索(ODS)的嗡嗡聲,這是來自Sectient Foundation的新開源框架。 ODS通過提供專有AI搜索引擎(如困惑和ChatGpt搜索)的強大替代方案來引起波浪,而這一切都是關於將大型語言模型(LLMS)授權使用高級推理代理,可利用Web搜索和其他工具來有效地回答您的查詢。

AI搜索景觀

當今的AI搜索工具(例如困惑和CHATGPT搜索)令人印象深刻,將LLM的知識和推理與實時Web搜索相結合以提供最新的答案。但是,這些系統通常被鎖定在專有門後面,這可能會使自定義和專業應用程序成為挑戰。

Sectient的聯合創始人Himanshu Tyagi與VentureBeat共享,“ AI搜索中的大多數創新一直在閉門造車後面。歷史上一直在閉門造車上落後於可用性和性能。ODS旨在彌合這一差距,證明開放的系統不僅可以競爭競爭,而且可以超越封閉的封閉式,並在質量,Qualtial和Pertectibility和Pertectibles和Pertectiments和Pertiorpers和Pertortibals and Pertectapers上。”

開放深度搜索(ODS)體系結構

ODS不僅僅是另一個工具。這是一個插件系統,您可以與DeepSeek-R1(例如GPT-4O和Claude)等開源型號進行集成。 ODS的核心有兩個主要組成部分:

打開搜索工具

此組件會帶您查詢,並蒐索網絡以獲取相關信息,以回饋LLM作為上下文。它也很聰明 - 它以各種方式重述您的查詢,以確保廣泛而多樣化的搜索。從搜索引擎獲取結果後,它提取片段和鏈接頁面,然後將塊和重新排列至最相關的內容中的零。它尤其擅長處理Wikipedia,Arxiv和PubMed等特定來源,並且可以在面對相互矛盾的信息時提示優先考慮可靠來源。

打開搜索工具

開放推理代理

該代理商採用您的查詢,並使用基本LLM和各種工具(包括開放搜索工具)來製作最終答案。 Soncient在ODS中提供了兩個不同的代理體系結構:

ODS-V1

此版本使用了一個反應代理框架與經過思考鏈(COT)推理相結合。反應代理在推理步驟(“思想”)和動作(例如使用搜索工具)和觀察(這些動作的結果)之間進行交替。 ODS-V1在此過程中迭代以達到答案。如果React代理擊中障礙,它將依靠COT的自願性,對多個COT響應進行採樣並選擇最常見的答案。

ODS-V2

此版本採用了用擁抱面孔的Smolagents庫構建的代碼鏈(COC)和代碼代理。 COC利用LLM生成和執行代碼段以解決問題的能力,而CodeAct則使用代碼生成進行計劃操作。 ODS-V2可以管理多個工具和代理,使其非常適合解決可能需要復雜的計劃和多次搜索迭代的複雜任務。

ODS開放推理代理 ODS架構信用:Arxiv

Tyagi解釋說:“雖然Chatgpt或Grok等工具通過對話代理提供了'深入研究',但ODS在不同層面上運作(更像是困惑AI背後的基礎架構),以提供智能檢索的基礎架構,而不僅僅是摘要。”

績效和實際結果

Soncient通過將ODS與開源DeepSeek-R1型號配對,並將其與Plyplexity AI和OpenAI的GPT-4O搜索預覽(例如GPT-4O和Llama-3.1-70B)等封閉源競爭者進行擬合。他們使用了框架和SimpleQA基準測試,以評估搜索啟用AI系統的準確性。

結果?感人的。 ODS-V1和ODS-V2與DeepSeek-R1合作時,都超出了困惑的旗艦產品。具有DeepSeek-R1的ODS-V2甚至超過了複雜幀基準測試的GPT-4O搜索預覽,並在SimpleQA上接近。

性能結果

一個令人著迷的見解是框架的效率。兩個ODS版本中的推理代理都學會了明智地使用搜索工具,通常會根據初始結果的質量來決定是否需要其他搜索。例如,與框架中更複雜,多跳的查詢相比,ODS-V2在較簡單的SimpleQA任務上使用了更少的Web搜索,從而優化了資源使用。

對企業的影響

對於希望利用實時信息來利用強大的AI推理功能的企業,ODS是改變遊戲規則的。它提供了專有AI搜索系統的透明,可定制且高性能的替代方案。插入首選的開源LLM和工具的能力意味著組織可以定制其AI堆棧並避免被鎖定到單個供應商中。

Tyagi指出:“ ODS的設計有模塊化。” “它動態地選擇了基於提示中提供的描述使用的工具。這意味著它可以流利地與陌生工具交互(只要它們很好地描述),就不需要事先暴露。”

但是,他警告說,如果工具集變得太混亂,則ODS性能可能會受到影響,“因此仔細的設計至關重要。”

Soncient使GitHub上的ODS代碼可用,邀請社區探索和貢獻。

Tyagi總結說:“最初,困惑和CHATGPT的力量是他們的先進技術,但是使用ODS,我們已經闡明了這一技術競爭環境。” “現在,我們的目標是通過我們的'開放輸入和開放輸出策略超越其功能,使用戶能夠無縫地將自定義代理集成到有感知的聊天中。”

相關文章
OpenAI承諾修復ChatGPT過度順從回應問題 OpenAI承諾修復ChatGPT過度順從回應問題 OpenAI計劃修訂其ChatGPT的AI模型更新流程,此前一次更新導致模型回應過度諂媚,引發廣泛用戶反饋。上週末,GPT-4o(ChatGPT背後的模型)更新後,社交媒體上的用戶報告稱,該平台對有害想法過度認同,引發病毒式迷因。螢幕截圖顯示ChatGPT支持了有問題的決定。週日,執行長Sam Altman在X上回應此問題,承諾立即採取行動。到了週二,他宣布撤回GPT-4o更新,並持續改進模型行為
AI驅動的零售實驗在Anthropic慘敗 AI驅動的零售實驗在Anthropic慘敗 想像一下,將一家小商店交給人工智慧,委託它處理從定價到客戶互動的一切。會出什麼問題呢?Anthropic最近的一項研究於週五發布,回答了這個問題:幾乎所有事情都出了問題。他們的AI助手Claude在舊金山辦公室經營了一個月的小商店,結果就像是為商學院學生寫下的警示故事,由一個毫無現實經驗的人撰寫——在這次實驗中,確實如此。Anthropic辦公室的「商店」是一個裝滿飲料和零食的小冰箱,搭配一個用於
OpenAI揭曉進階AI推理模型,o3與o4-mini OpenAI揭曉進階AI推理模型,o3與o4-mini OpenAI於週三推出o3與o4-mini,這是兩款新型AI模型,設計為在回答前暫停並分析問題。OpenAI宣稱o3是其迄今最先進的推理模型,在數學、編碼、推理、科學及視覺理解測試中超越先前模型。同時,o4-mini在成本、速度與性能間取得平衡,是開發者打造AI驅動應用的理想選擇。與早期模型不同,o3與o4-mini利用ChatGPT工具,如網頁瀏覽、Python程式碼執行、圖像處理及圖像生成。從
評論 (1)
0/200
PeterNelson
PeterNelson 2025-07-22 09:25:03

Whoa, Open Deep Search sounds like a game-changer! Love that it’s open-source—finally, a way to stick it to the big tech gatekeepers. Can it really keep up with Perplexity’s speed, though? 🤔 Excited to see where this goes!

回到頂部
OR