

Các công cụ đại lý AI mới của Openai có thể cách mạng hóa trải nghiệm mã hóa của bạn
Ngày 26 tháng 4 năm 2025
FrankJackson
0
Nếu bạn đã dành bất kỳ thời gian nào với tư cách là nhà phát triển sản xuất, bạn sẽ nhận thức rõ rằng giao diện lập trình ứng dụng (API) có thể thay đổi trên một xu, thường là bất chợt của nhà cung cấp. Một ngày nọ, ứng dụng của bạn đang hoạt động suôn sẻ và bạn đang mơ về tương lai tươi sáng của nó. Sáng hôm sau, bạn thức dậy để tìm ra một trong những nhà cung cấp API của bạn đã công bố một thay đổi lớn, buộc bạn phải dành sáu tháng tiếp theo để viết lại ứng dụng của mình để thích nghi. Tin tôi đi, tôi đã ở đó.
Các ứng dụng dựa trên AI cũng không ngoại lệ đối với quy tắc của cuộc sống API này. Openai gần đây đã công bố việc giới thiệu API Phản hồi, điều đó có nghĩa là việc chiếu sáng API trợ lý của nó đang diễn ra, được đặt vào khoảng năm 2026.
Như với hầu hết các bản cập nhật API, API phản hồi mới hứa hẹn nhiều tính năng hơn, hiệu suất tốt hơn và ít đau đầu hơn. Nhưng bất chấp những cải tiến này, những người chấp nhận API trước đó sẽ có đầy đủ các nhiệm vụ mới.
Openai cũng đã giới thiệu một loạt các tính năng cấp lập trình mới để xây dựng các đại lý AI, bao gồm API mới. Hãy dành một chút thời gian để hiểu bối cảnh của sự thay đổi này.
Kể từ sự gia tăng của AI (Gen AI), một vài năm trước, có vẻ như mọi sản phẩm và dịch vụ đã nhảy lên Bandwagon AI, thêm các tính năng hỗ trợ AI vào các dịch vụ của họ. Chúng không phải lúc nào cũng được xây dựng từ đầu; Nhiều công ty đang tận dụng các API từ các nhà cung cấp AI như Openai. Các API này cung cấp chức năng AI với chi phí dự đoán cho mỗi giao dịch. Ví dụ, với một đô la duy nhất, một nhà phát triển có thể thực hiện khoảng 67 GPT-4,5 truy vấn trò chuyện điển hình, 1.176 truy vấn GPT-4O hoặc một truy vấn mini GPT-4O khổng lồ.
Nhờ API từ OpenAI và các công ty AI khác, các nhà phát triển giờ đây có thể thêm các khả năng AI vào mã của họ với các cuộc gọi chức năng đơn giản và thẻ tín dụng, bỏ qua nhiều năm phát triển và chi phí nghiên cứu và cơ sở hạ tầng và quá mức.
API phản hồi mới
Cho đến bây giờ, OpenAI đã cung cấp API hoàn thành trò chuyện để gửi lời nhắc trò chuyện đến TATGPT và nhận phản hồi và API Trợ lý, cho phép các đại lý thực hiện các tệp lý luận và truy cập nhiều bước. API phản hồi mới hợp nhất các khả năng của cả hai. Trong khi API hoàn thành trò chuyện sẽ gắn bó, API trợ lý được lên kế hoạch nghỉ hưu vào năm tới, mở đường cho API phản hồi mạnh mẽ hơn.
Giá cho API phản hồi có thể được tìm thấy trên trang giá của Openai và thay đổi tùy thuộc vào mô hình và cách sử dụng.
API phản hồi đi kèm với ba công cụ tích hợp cho các lập trình viên: tìm kiếm web, tìm kiếm tệp và sử dụng máy tính.
Công cụ tìm kiếm web
Nếu bạn đã từng sử dụng TATGPT để quét web và biên dịch câu trả lời, bạn đã quen thuộc với những gì công cụ tìm kiếm web làm. Với API trả lời, các nhà phát triển có thể khởi tạo các truy vấn như vậy trực tiếp từ các chương trình của họ. API trả về các phản hồi văn bản cùng với các liên kết đến các nguồn và trích dẫn nội tuyến. Trong khi OpenAI báo cáo rằng các thử nghiệm với GPT-4O chỉ cho thấy tỷ lệ chính xác 38%, thì bản xem trước tìm kiếm GPT-4O và bản xem trước tìm kiếm mini GPT-4O đạt được tỷ lệ chính xác 90%. Không hoàn hảo, nhưng khá tốt, phải không?
Công cụ tìm kiếm tệp
Tiếp theo là công cụ tìm kiếm tệp, được thiết kế để tìm kiếm thông qua thư viện tài liệu của công ty bạn. Openai đảm bảo với người dùng rằng dữ liệu kinh doanh sẽ không được sử dụng để đào tạo AI của mình, vì vậy bạn có thể cảm thấy phần nào an toàn khi tải lên dữ liệu của mình. Tuy nhiên, ở mức 0,10 đô la mỗi gigabyte mỗi tháng, lưu trữ tệp không rẻ. Chẳng hạn, cơ sở dữ liệu tài liệu 57TB của công ty nhỏ của tôi sẽ có giá gần 6.000 đô la mỗi tháng để lưu trữ với Openai. Trong khi các công cụ tìm kiếm AI có thể phá vỡ các silo, giá cả có thể hạn chế tính thực tế của tính năng này đối với nhiều doanh nghiệp.
Công cụ sử dụng máy tính
Cuối cùng, có công cụ sử dụng máy tính, là trung tâm của tác nhân vận hành của Openai. Nó có nghĩa là đọc màn hình và thực hiện các hành động dựa trên những gì nó nhìn thấy. Từ các bản demo, rõ ràng là công cụ này vẫn còn cách thức trước khi nó trở nên hữu ích trên toàn cầu. Chúng ta sẽ phải để mắt đến sự tiến bộ của nó.
Đại lý SDK
API về cơ bản là một tập hợp các điểm cuối hoặc các cuộc gọi chức năng cho phép tương tác với một hệ thống bên ngoài. Mặt khác, SDK (Bộ phát triển phần mềm) là một gói toàn diện hơn bao gồm các công cụ phần mềm, API, thư viện và tiện ích, tất cả đều hoạt động cùng nhau.
Openai đã giới thiệu các đại lý SDK, một bộ công cụ để xây dựng, gỡ lỗi và các tác nhân giám sát. Bộ này kết hợp các phản hồi API và thêm dàn nhạc quy trình công việc, cho phép các nhà phát triển thực hiện các nhiệm vụ và lý luận nhiều bước. Nó cũng cho phép tạo ra các nhóm tác nhân, mỗi nhóm có vai trò cụ thể và bao gồm chức năng "Hand-off" trong đó một tác nhân có thể chuyển các tác vụ cho một tác vụ khác.
Có lẽ một trong những tính năng quan trọng nhất là bảng điều khiển giám sát, cho phép các nhà phát triển theo dõi mọi tương tác với AI, xác định các tác nhân nào được sử dụng cho những gì và cách chúng được giao nhiệm vụ. Đưa ra vấn đề ảo giác AI, điều quan trọng là phải giữ các tab về những gì các nhiệm vụ độc lập này đang làm.
Bạn nghĩ gì về các bản cập nhật mới nhất của Openai?
Bạn đang có kế hoạch tích hợp API phản hồi vào các dự án của bạn, hay việc Sunsting của API trợ lý cho bạn tạm dừng? Suy nghĩ của bạn về các công cụ tích hợp như tìm kiếm web, tìm kiếm tệp và sử dụng máy tính là gì? Họ có giải quyết các nhu cầu thực sự, hoặc họ mang lại những thách thức mới?
Và những gì về các đại lý SDK? Bạn có thấy đó là một người thay đổi trò chơi cho phát triển AI Agent, hoặc vẫn còn những khoảng trống để được lấp đầy? Chia sẻ những hiểu biết của bạn trong các ý kiến dưới đây.

Giữ kết nối với các bản cập nhật dự án hàng ngày của tôi trên phương tiện truyền thông xã hội. Đừng quên đăng ký nhận bản tin cập nhật hàng tuần của tôi và theo dõi tôi trên Twitter/X tại @DavidgeWirtz, trên facebook tại facebook.com/davidgewirtz, trên Instagram tại Instagram.com
Bài viết liên quan
Davos 2025: Điều hướng sự trở lại của Trump và sự thay đổi kinh tế toàn cầu
Davos 2025 là một cảnh tượng của những ngọn núi phủ tuyết, các nhà lãnh đạo thế giới và những người khổng lồ kinh tế, nhưng tiếng vang thực sự là về sự trở lại của một gương mặt quen thuộc: Donald Trump. Lễ nhậm chức thứ hai của ông với tư cách là Tổng thống Hoa Kỳ và địa chỉ ảo của ông cho diễn đàn đã tạo tiền đề cho việc đánh giá lại thương mại toàn cầu, an ninh, a
Super Mario Brothers: A Dark Fan Fiction Adventure
Nếu bạn nghĩ rằng Super Mario Brothers Universe là tất cả về màu sắc tươi sáng và những cuộc phiêu lưu vui vẻ, hãy nghĩ lại. Đi sâu vào tiểu thuyết người hâm mộ hỗ trợ AI này lật kịch bản, đưa Mario và Luigi vào một thế giới đang ở rìa tuyệt vọng, với các liên minh bất ngờ và ngày tận thế sắp xảy ra
Bài hát viết bài hát được hỗ trợ bởi AI
Thế giới âm nhạc đang trải qua một sự biến đổi hấp dẫn khi Trí tuệ nhân tạo (AI) bước vào vương quốc của sáng tác. Không còn chỉ là một khái niệm khoa học viễn tưởng, sáng tác AI ở đây, thách thức các quan điểm truyền thống của chúng tôi về sự sáng tạo, quyền tác giả và biểu hiện nghệ thuật. Hãy khám phá cách AI là CR
Nhận xét (0)
0/200






Nếu bạn đã dành bất kỳ thời gian nào với tư cách là nhà phát triển sản xuất, bạn sẽ nhận thức rõ rằng giao diện lập trình ứng dụng (API) có thể thay đổi trên một xu, thường là bất chợt của nhà cung cấp. Một ngày nọ, ứng dụng của bạn đang hoạt động suôn sẻ và bạn đang mơ về tương lai tươi sáng của nó. Sáng hôm sau, bạn thức dậy để tìm ra một trong những nhà cung cấp API của bạn đã công bố một thay đổi lớn, buộc bạn phải dành sáu tháng tiếp theo để viết lại ứng dụng của mình để thích nghi. Tin tôi đi, tôi đã ở đó.
Các ứng dụng dựa trên AI cũng không ngoại lệ đối với quy tắc của cuộc sống API này. Openai gần đây đã công bố việc giới thiệu API Phản hồi, điều đó có nghĩa là việc chiếu sáng API trợ lý của nó đang diễn ra, được đặt vào khoảng năm 2026.
Như với hầu hết các bản cập nhật API, API phản hồi mới hứa hẹn nhiều tính năng hơn, hiệu suất tốt hơn và ít đau đầu hơn. Nhưng bất chấp những cải tiến này, những người chấp nhận API trước đó sẽ có đầy đủ các nhiệm vụ mới.
Openai cũng đã giới thiệu một loạt các tính năng cấp lập trình mới để xây dựng các đại lý AI, bao gồm API mới. Hãy dành một chút thời gian để hiểu bối cảnh của sự thay đổi này.
Kể từ sự gia tăng của AI (Gen AI), một vài năm trước, có vẻ như mọi sản phẩm và dịch vụ đã nhảy lên Bandwagon AI, thêm các tính năng hỗ trợ AI vào các dịch vụ của họ. Chúng không phải lúc nào cũng được xây dựng từ đầu; Nhiều công ty đang tận dụng các API từ các nhà cung cấp AI như Openai. Các API này cung cấp chức năng AI với chi phí dự đoán cho mỗi giao dịch. Ví dụ, với một đô la duy nhất, một nhà phát triển có thể thực hiện khoảng 67 GPT-4,5 truy vấn trò chuyện điển hình, 1.176 truy vấn GPT-4O hoặc một truy vấn mini GPT-4O khổng lồ.
Nhờ API từ OpenAI và các công ty AI khác, các nhà phát triển giờ đây có thể thêm các khả năng AI vào mã của họ với các cuộc gọi chức năng đơn giản và thẻ tín dụng, bỏ qua nhiều năm phát triển và chi phí nghiên cứu và cơ sở hạ tầng và quá mức.
API phản hồi mới
Cho đến bây giờ, OpenAI đã cung cấp API hoàn thành trò chuyện để gửi lời nhắc trò chuyện đến TATGPT và nhận phản hồi và API Trợ lý, cho phép các đại lý thực hiện các tệp lý luận và truy cập nhiều bước. API phản hồi mới hợp nhất các khả năng của cả hai. Trong khi API hoàn thành trò chuyện sẽ gắn bó, API trợ lý được lên kế hoạch nghỉ hưu vào năm tới, mở đường cho API phản hồi mạnh mẽ hơn.
Giá cho API phản hồi có thể được tìm thấy trên trang giá của Openai và thay đổi tùy thuộc vào mô hình và cách sử dụng.
API phản hồi đi kèm với ba công cụ tích hợp cho các lập trình viên: tìm kiếm web, tìm kiếm tệp và sử dụng máy tính.
Công cụ tìm kiếm web
Nếu bạn đã từng sử dụng TATGPT để quét web và biên dịch câu trả lời, bạn đã quen thuộc với những gì công cụ tìm kiếm web làm. Với API trả lời, các nhà phát triển có thể khởi tạo các truy vấn như vậy trực tiếp từ các chương trình của họ. API trả về các phản hồi văn bản cùng với các liên kết đến các nguồn và trích dẫn nội tuyến. Trong khi OpenAI báo cáo rằng các thử nghiệm với GPT-4O chỉ cho thấy tỷ lệ chính xác 38%, thì bản xem trước tìm kiếm GPT-4O và bản xem trước tìm kiếm mini GPT-4O đạt được tỷ lệ chính xác 90%. Không hoàn hảo, nhưng khá tốt, phải không?
Công cụ tìm kiếm tệp
Tiếp theo là công cụ tìm kiếm tệp, được thiết kế để tìm kiếm thông qua thư viện tài liệu của công ty bạn. Openai đảm bảo với người dùng rằng dữ liệu kinh doanh sẽ không được sử dụng để đào tạo AI của mình, vì vậy bạn có thể cảm thấy phần nào an toàn khi tải lên dữ liệu của mình. Tuy nhiên, ở mức 0,10 đô la mỗi gigabyte mỗi tháng, lưu trữ tệp không rẻ. Chẳng hạn, cơ sở dữ liệu tài liệu 57TB của công ty nhỏ của tôi sẽ có giá gần 6.000 đô la mỗi tháng để lưu trữ với Openai. Trong khi các công cụ tìm kiếm AI có thể phá vỡ các silo, giá cả có thể hạn chế tính thực tế của tính năng này đối với nhiều doanh nghiệp.
Công cụ sử dụng máy tính
Cuối cùng, có công cụ sử dụng máy tính, là trung tâm của tác nhân vận hành của Openai. Nó có nghĩa là đọc màn hình và thực hiện các hành động dựa trên những gì nó nhìn thấy. Từ các bản demo, rõ ràng là công cụ này vẫn còn cách thức trước khi nó trở nên hữu ích trên toàn cầu. Chúng ta sẽ phải để mắt đến sự tiến bộ của nó.
Đại lý SDK
API về cơ bản là một tập hợp các điểm cuối hoặc các cuộc gọi chức năng cho phép tương tác với một hệ thống bên ngoài. Mặt khác, SDK (Bộ phát triển phần mềm) là một gói toàn diện hơn bao gồm các công cụ phần mềm, API, thư viện và tiện ích, tất cả đều hoạt động cùng nhau.
Openai đã giới thiệu các đại lý SDK, một bộ công cụ để xây dựng, gỡ lỗi và các tác nhân giám sát. Bộ này kết hợp các phản hồi API và thêm dàn nhạc quy trình công việc, cho phép các nhà phát triển thực hiện các nhiệm vụ và lý luận nhiều bước. Nó cũng cho phép tạo ra các nhóm tác nhân, mỗi nhóm có vai trò cụ thể và bao gồm chức năng "Hand-off" trong đó một tác nhân có thể chuyển các tác vụ cho một tác vụ khác.
Có lẽ một trong những tính năng quan trọng nhất là bảng điều khiển giám sát, cho phép các nhà phát triển theo dõi mọi tương tác với AI, xác định các tác nhân nào được sử dụng cho những gì và cách chúng được giao nhiệm vụ. Đưa ra vấn đề ảo giác AI, điều quan trọng là phải giữ các tab về những gì các nhiệm vụ độc lập này đang làm.
Bạn nghĩ gì về các bản cập nhật mới nhất của Openai?
Bạn đang có kế hoạch tích hợp API phản hồi vào các dự án của bạn, hay việc Sunsting của API trợ lý cho bạn tạm dừng? Suy nghĩ của bạn về các công cụ tích hợp như tìm kiếm web, tìm kiếm tệp và sử dụng máy tính là gì? Họ có giải quyết các nhu cầu thực sự, hoặc họ mang lại những thách thức mới?
Và những gì về các đại lý SDK? Bạn có thấy đó là một người thay đổi trò chơi cho phát triển AI Agent, hoặc vẫn còn những khoảng trống để được lấp đầy? Chia sẻ những hiểu biết của bạn trong các ý kiến dưới đây.
Giữ kết nối với các bản cập nhật dự án hàng ngày của tôi trên phương tiện truyền thông xã hội. Đừng quên đăng ký nhận bản tin cập nhật hàng tuần của tôi và theo dõi tôi trên Twitter/X tại @DavidgeWirtz, trên facebook tại facebook.com/davidgewirtz, trên Instagram tại Instagram.com












