Các nhà nghiên cứu phát triển đối thủ nguồn mở thành mô hình 'lý luận' $ 50 của Openai với giá dưới 50 đô la

Trang chủ

Tin tức

Ngày 21 tháng 4 năm 2025

JosephWalker

139

# openai # DeepSeek

Các nhà nghiên cứu phát triển đối thủ nguồn mở thành mô hình 'lý luận' $ 50 của Openai với giá dưới 50 đô la

Thứ Sáu tuần trước, một bài báo nghiên cứu đột phá từ các chuyên gia AI tại Stanford và Đại học Washington đã gây chú ý, tiết lộ rằng họ đã phát triển một mô hình AI "suy luận" có tên s1 với chi phí dưới 50 đô la tín dụng tính toán đám mây. Phát hiện này đang làm rung chuyển thế giới AI, vì s1 có thể sánh ngang với các mô hình hàng đầu như o1 của OpenAI và R1 của DeepSeek khi đối mặt với các thách thức về toán học và lập trình.

Mô hình s1, cùng với tất cả chi tiết hấp dẫn về dữ liệu huấn luyện và mã nguồn của nó, hiện đã có sẵn trên GitHub. Nhóm nghiên cứu bắt đầu với một mô hình cơ bản thông thường và sau đó đưa nó qua quá trình tinh cất bằng một kỹ thuật gọi là chưng cất. Quá trình này liên quan đến việc trích xuất "nước cốt suy luận" từ một mô hình AI khác bằng cách huấn luyện dựa trên các phản hồi của nó. Trong trường hợp này, s1 đã học được sự thông minh từ mô hình Gemini 2.0 Flash Thinking Experimental của Google. Đây là một chiến thuật tương tự như những gì các nhà nghiên cứu tại Berkeley đã sử dụng để tạo ra mô hình suy luận AI của riêng họ với chi phí khoảng 450 đô la chỉ trong tháng trước.

Đối với một số người, ý tưởng rằng một nhóm nghiên cứu nhỏ vẫn có thể tạo ra sóng gió trong lĩnh vực AI mà không cần ngân sách khổng lồ là điều thú vị. Nhưng sự xuất hiện của s1 cũng đặt ra một số câu hỏi nghiêm túc về tương lai của việc phát triển mô hình AI. Nếu một mô hình cạnh tranh với những mô hình được xây dựng bằng hàng triệu đô la có thể được sao chép với ngân sách eo hẹp, điều gì ngăn cản mọi người làm điều tương tự?

Không ngạc nhiên khi các gã khổng lồ trong lĩnh vực AI không hài lòng. Chẳng hạn, OpenAI đã chỉ trích DeepSeek, cáo buộc họ sử dụng dữ liệu API của mình để thúc đẩy quá trình chưng cất mô hình. Trong khi đó, nhóm s1 tập trung vào việc tìm cách đơn giản nhất để đạt được hiệu suất suy luận vững chắc và một thứ gọi là "tăng quy mô thời gian kiểm tra," nơi một mô hình AI có thêm thời gian để suy nghĩ trước khi trả lời. Đây cũng là những cải tiến mà mô hình o1 của OpenAI đã mang lại, và những công ty khác như DeepSeek đã cố gắng bắt chước theo cách riêng của họ.

Bài báo về s1 gợi ý rằng bạn có thể chưng cất các mô hình suy luận với một tập dữ liệu tương đối nhỏ bằng kỹ thuật được gọi là tinh chỉnh có giám sát (SFT). Điều này liên quan đến việc huấn luyện mô hình AI để sao chép các hành vi cụ thể từ một tập dữ liệu, và nó rẻ hơn so với học tăng cường quy mô lớn mà DeepSeek đã sử dụng cho mô hình R1 của họ, vốn cạnh tranh với o1 của OpenAI.

Google cung cấp Gemini 2.0 Flash Thinking Experimental miễn phí thông qua nền tảng Google AI Studio, mặc dù có giới hạn hàng ngày. Nhưng có một vấn đề—điều khoản của Google không cho phép kỹ nghệ ngược các mô hình của họ để tạo ra các dịch vụ cạnh tranh. Chúng tôi đang chờ phản hồi từ Google về việc này.

Bản thân mô hình s1 bắt đầu như một mô hình AI thông thường từ phòng thí nghiệm Qwen của Alibaba, mà bất kỳ ai cũng có thể tải xuống miễn phí. Để huấn luyện s1, các nhà nghiên cứu đã xây dựng một tập dữ liệu chỉ gồm 1.000 câu hỏi được chọn lọc cẩn thận, cùng với các câu trả lời và quá trình "suy nghĩ" đằng sau mỗi câu, nhờ vào Gemini 2.0 của Google. Toàn bộ quá trình huấn luyện mất chưa đến 30 phút trên 16 GPU Nvidia H100. Theo Niklas Muennighoff, một nhà nghiên cứu tại Stanford tham gia dự án, bạn có thể thực hiện điều này ngày hôm nay với chi phí tính toán khoảng 20 đô la.

Các nhà nghiên cứu cũng thực hiện một động thái thông minh để khiến s1 kiểm tra lại công việc của mình và kéo dài thời gian "suy nghĩ"—họ chỉ đơn giản bảo nó "chờ." Việc thêm từ này trong quá trình suy luận của s1 đã giúp nó đưa ra câu trả lời chính xác hơn một chút, theo bài báo.

Nhìn về phía trước đến năm 2025, các gã khổng lồ công nghệ như Meta, Google và Microsoft được dự đoán sẽ đổ hàng trăm tỷ đô la vào cơ sở hạ tầng AI, phần lớn trong số đó sẽ dành cho việc huấn luyện làn sóng mô hình AI tiếp theo. Mặc dù chưng cất được chứng minh là một cách hiệu quả để tái tạo khả năng AI với chi phí thấp, nhưng nó sẽ không dẫn đến việc tạo ra các mô hình AI đột phá hoàn toàn mới trong thời gian gần.

Bài viết liên quan

Cựu Kỹ sư OpenAI Chia sẻ Thông tin về Văn hóa Công ty và Tăng trưởng Nhanh chóng Ba tuần trước, Calvin French-Owen, một kỹ sư đã đóng góp vào một sản phẩm chủ chốt của OpenAI, đã rời công ty.Gần đây, anh ấy đã chia sẻ một bài đăng blog hấp dẫn, mô tả chi tiết một năm làm việc tại

Google Ra Mắt Các Mô Hình AI Gemini 2.5 Sẵn Sàng Sản Xuất để Cạnh Tranh với OpenAI trên Thị Trường Doanh Nghiệp Google tăng cường chiến lược AI vào thứ Hai, ra mắt các mô hình Gemini 2.5 tiên tiến cho doanh nghiệp và giới thiệu biến thể tiết kiệm chi phí để cạnh tranh về giá và hiệu suất.Công ty thuộc sở hữu củ

Meta cung cấp lương cao cho nhân tài AI, phủ nhận tiền thưởng ký hợp đồng 100 triệu USD Meta đang thu hút các nhà nghiên cứu AI đến phòng thí nghiệm siêu trí tuệ mới của mình với các gói lương thưởng trị giá hàng triệu USD. Tuy nhiên, các tuyên bố về tiền thưởng ký hợp đồng 100 triệu USD

Nhận xét (7)

0/200

Nộp

StevenWilson

16:00:59 GMT+07:00 Ngày 08 tháng 8 năm 2025

Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔

BenRoberts

09:48:18 GMT+07:00 Ngày 01 tháng 8 năm 2025

Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀

DonaldGonzález

06:45:55 GMT+07:00 Ngày 23 tháng 4 năm 2025

s1モデルが50ドル未満で開発されたなんて信じられない！OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい！🚀

HarryRoberts

05:38:34 GMT+07:00 Ngày 23 tháng 4 năm 2025

This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀

HenryWalker

05:34:07 GMT+07:00 Ngày 23 tháng 4 năm 2025

Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀

GregoryAdams

21:19:22 GMT+07:00 Ngày 22 tháng 4 năm 2025

s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀

Tin tức hàng đầu

Gemini 2.5 Pro hiện không giới hạn và rẻ hơn Claude, GPT-4O Máy phát video AI hàng đầu vào năm 2025: Pika Labs so với các lựa chọn thay thế Lồng tiếng AI: Hướng dẫn Tối ưu để Tạo Giọng Nói Thực tế Openai tăng cường trợ lý giọng nói AI để trò chuyện tốt hơn Notebooklm mở rộng toàn cầu, thêm các slide và kiểm tra thực tế nâng cao Các trung tâm dữ liệu của Hoa Kỳ có thể mở khóa 76 GW công suất năng lượng mới Người sáng lập AI để tiêu thụ sức mạnh của nhiều NYC vào năm 2026, người sáng lập Sao chép giọng nói AI: Hướng dẫn tối thượng để làm chủ chuyển đổi giọng nói Trải nghiệm ô chữ I/O do AI hỗ trợ Giám đốc điều hành NVIDIA làm rõ những quan niệm sai lầm về tác động thị trường của Deepseek

Hơn

Đặc trưng