Trang chủ Tin tức Mở sâu tìm kiếm đến để thách thức sự bối rối và tìm kiếm Chatpt

Mở sâu tìm kiếm đến để thách thức sự bối rối và tìm kiếm Chatpt

Ngày 02 tháng 5 năm 2025
SamuelThomas
0

Nếu bạn ở trong thế giới công nghệ, bạn có thể đã nghe về tiếng vang xung quanh Open Deep Search (ODS), khung công tác nguồn mở mới từ Tổ chức Sentient. ODS đang tạo sóng bằng cách cung cấp một sự thay thế mạnh mẽ cho các công cụ tìm kiếm AI độc quyền như Perplexity và Chatgpt Search, và tất cả chỉ là trao quyền cho các mô hình ngôn ngữ lớn (LLM) với các tác nhân lý luận nâng cao tận dụng tìm kiếm web và các công cụ khác để trả lời các truy vấn của bạn một cách hiệu quả.

Phong cảnh tìm kiếm AI

Các công cụ tìm kiếm AI ngày nay, chẳng hạn như Perplexity và Chatgpt tìm kiếm, rất ấn tượng, kết hợp kiến ​​thức và lý luận của LLM với tìm kiếm trên web thời gian thực để đưa ra câu trả lời cập nhật. Tuy nhiên, các hệ thống này thường bị khóa đằng sau các cửa độc quyền, có thể khiến các ứng dụng tùy chỉnh và chuyên dụng trở thành một thách thức.

Himanshu Tyagi, người đồng sáng lập của Bentient, được chia sẻ với VentureBeat, "Hầu hết sự đổi mới trong tìm kiếm AI đã xảy ra đằng sau cánh cửa đóng kín. Những nỗ lực nguồn mở trong lịch sử đã bị tụt lại trong khả năng sử dụng và hiệu suất.

Mở kiến ​​trúc tìm kiếm sâu (ODS)

ODS không chỉ là một công cụ khác; Đó là một hệ thống cắm và chơi mà bạn có thể tích hợp với cả hai mô hình nguồn mở như Deepseek-R1 và các mô hình đã đóng như GPT-4O và Claude. Tại cốt lõi của nó, ODS có hai thành phần chính:

Mở công cụ tìm kiếm

Thành phần này lấy truy vấn của bạn và quét web để biết thông tin liên quan để cung cấp lại cho LLM làm bối cảnh. Nó thông minh, quá, nó đã đặt lại truy vấn của bạn theo nhiều cách khác nhau để đảm bảo tìm kiếm rộng và đa dạng. Sau khi tìm nạp kết quả từ một công cụ tìm kiếm, nó trích xuất các đoạn trích và các trang được liên kết, sau đó sử dụng chunking và xếp hạng lại về 0 trên nội dung phù hợp nhất. Nó đặc biệt lão luyện trong việc xử lý các nguồn cụ thể như Wikipedia, ARXIV và PubMed, và có thể được nhắc ưu tiên các nguồn đáng tin cậy khi phải đối mặt với thông tin mâu thuẫn.

Mở công cụ tìm kiếm

Đại lý lý luận mở

Đại lý này lấy truy vấn của bạn và, sử dụng cơ sở LLM và các công cụ khác nhau (bao gồm cả công cụ tìm kiếm mở), tạo ra một câu trả lời cuối cùng. Sentient cung cấp hai kiến ​​trúc đại lý riêng biệt trong ODS:

ODS-V1

Phiên bản này sử dụng khung tác nhân phản ứng kết hợp với lý luận chuỗi (COT). Các tác nhân phản ứng xen kẽ giữa các bước lý luận ("suy nghĩ") và các hành động (như sử dụng công cụ tìm kiếm) và các quan sát (kết quả của những hành động đó). ODS-V1 lặp lại trong quá trình này để đạt được câu trả lời. Nếu tác nhân phản ứng chạm vào một snag, nó sẽ trở lại với sự tự thống nhất của cot, lấy mẫu nhiều phản hồi COT và chọn câu trả lời phổ biến nhất.

ODS-V2

Phiên bản này sử dụng mã chuỗi (COC) và một tác nhân Codeact, được xây dựng với thư viện Smolagents ôm mặt. CoC khai thác khả năng của LLM để tạo và thực thi các đoạn mã để giải quyết các vấn đề, trong khi Codeact sử dụng việc tạo mã để lập kế hoạch hành động. ODS-V2 có thể quản lý nhiều công cụ và tác nhân, làm cho nó lý tưởng để giải quyết các nhiệm vụ phức tạp có thể cần lập kế hoạch tinh vi và nhiều lần lặp lại tìm kiếm.

Đại lý lý luận mở ODS Tín dụng kiến ​​trúc ODS: Arxiv

Tyagi giải thích, "Trong khi các công cụ như TATGPT hoặc GROK cung cấp 'nghiên cứu sâu' thông qua các đại lý đàm thoại, ODS hoạt động ở một cấp độ khác, giống như cơ sở hạ tầng đằng sau Perplexity AI, cung cấp kiến ​​trúc cơ bản giúp cung cấp năng lượng cho việc truy xuất thông minh, không chỉ tóm tắt."

Hiệu suất và kết quả thực tế

Sentient đưa ODS vào thử nghiệm bằng cách ghép nối nó với mô hình DeepSeek-R1 nguồn mở và rỗ nó chống lại các đối thủ cạnh tranh nguồn đóng như Perplexity AI và xem trước tìm kiếm GPT-4O của Openai, cũng như LLM độc lập như GPT-4O và LLAMA-3.1-70B. Họ đã sử dụng các khung và điểm chuẩn đơn giản, được điều chỉnh để đánh giá độ chính xác của các hệ thống AI hỗ trợ tìm kiếm.

Kết quả? Ấn tượng. Cả ODS-V1 và ODS-V2, khi hợp tác với Deepseek-R1, các sản phẩm hàng đầu của Perplexity. ODS-V2 với DeepSeek-R1 thậm chí đã vượt qua bản xem trước tìm kiếm GPT-4O trên điểm chuẩn khung hình phức tạp và đã đến gần trên SimpleQA.

Kết quả hiệu suất

Một cái nhìn sâu sắc hấp dẫn là hiệu quả của khuôn khổ. Các tác nhân lý do trong cả hai phiên bản ODS đã học cách sử dụng công cụ tìm kiếm một cách khôn ngoan, thường quyết định liệu một tìm kiếm khác có cần thiết hay không dựa trên chất lượng của kết quả ban đầu. Ví dụ: ODS-V2 đã sử dụng ít tìm kiếm trên web hơn trên các tác vụ Simpleqa đơn giản hơn so với các truy vấn đa hop phức tạp hơn trong các khung, tối ưu hóa việc sử dụng tài nguyên.

Ý nghĩa đối với doanh nghiệp

Đối với các doanh nghiệp muốn khai thác các khả năng lý luận của AI mạnh mẽ với thông tin thời gian thực, ODS là một người thay đổi trò chơi. Nó cung cấp một sự thay thế trong suốt, có thể tùy chỉnh và hiệu suất cao cho các hệ thống tìm kiếm AI độc quyền. Khả năng cắm vào các LLM và công cụ nguồn mở ưa thích có nghĩa là các tổ chức có thể điều chỉnh ngăn xếp AI của họ và tránh bị khóa vào một nhà cung cấp duy nhất.

"ODS được thiết kế với mô -đun trong tâm trí," Tyagi lưu ý. "Nó tự động chọn công cụ nào sẽ sử dụng dựa trên các mô tả được cung cấp trong lời nhắc. Điều này có nghĩa là nó có thể tương tác với các công cụ không quen thuộc một cách trôi chảy, miễn là chúng được mô tả rõ ràng mà không cần tiếp xúc trước."

Tuy nhiên, ông cảnh báo rằng hiệu suất ODS có thể bị ảnh hưởng nếu bộ công cụ trở nên quá lộn xộn, "vì vậy thiết kế cẩn thận là rất quan trọng."

Sentient đã cung cấp mã ODS trên GitHub, mời cộng đồng khám phá và đóng góp.

"Ban đầu, sức mạnh của sự bối rối và Chatpt là công nghệ tiên tiến của họ, nhưng với ODS, chúng tôi đã san bằng sân chơi công nghệ này", Tyagi kết luận. "Bây giờ chúng tôi nhằm mục đích vượt qua khả năng của chúng thông qua chiến lược mở đầu vào và đầu vào mở của chúng tôi, cho phép người dùng tích hợp liền mạch các tác nhân tùy chỉnh vào trò chuyện tình cảm."

Bài viết liên quan
Use chatgpt para crear una carta de presentación superior: consejos y trucos Use chatgpt para crear una carta de presentación superior: consejos y trucos Crear un currículum que resume perfectamente su carrera es lo suficientemente desafiante, pero las solicitudes de empleo a menudo también requieren una carta de presentación. Esta carta es su oportunidad de sumergirse en los detalles de por qué está interesado en la empresa, qué lo califica para el puesto y por qué es el mejor sincero
¿Cómo juzga la IA? Antropic estudia los valores de Claude ¿Cómo juzga la IA? Antropic estudia los valores de Claude A medida que los modelos de IA como Claude de Anthrope se involucran cada vez más con los usuarios en valores humanos complejos, desde puntas de crianza hasta conflictos en el lugar de trabajo, sus respuestas reflejan inherentemente un conjunto de principios rectores. Pero, ¿cómo podemos realmente comprender los valores que expresa una IA al interactuar con millones de usuarios? Hormiga
MCP estandariza la conectividad de IA con herramientas y datos: surge un nuevo protocolo MCP estandariza la conectividad de IA con herramientas y datos: surge un nuevo protocolo Si te estás sumergiendo en el mundo de la inteligencia artificial (IA), probablemente hayas notado lo crucial que es obtener diferentes modelos de IA, fuentes de datos y herramientas para jugar bien juntos. Ahí es donde entra el Protocolo de contexto del modelo (MCP), actuando como un cambio de juego en la estandarización de la conectividad de IA. T
Nhận xét (0)
0/200
Back to Top
OR