Các nhà nghiên cứu phát triển đối thủ nguồn mở thành mô hình 'lý luận' $ 50 của Openai với giá dưới 50 đô la

Thứ Sáu tuần trước, một bài báo nghiên cứu đột phá từ các chuyên gia AI tại Stanford và Đại học Washington đã xuất hiện, tiết lộ rằng họ đã phát triển một mô hình "Lý luận" AI, được đặt tên là S1, với giá dưới 50 đô la trong các khoản tín dụng tính toán đám mây. Sự tiết lộ này đang làm rung chuyển thế giới AI, vì S1 giữ chính nó chống lại các mô hình hàng đầu như O1 và Deepseek's R1 khi nói đến việc giải quyết các thử thách toán học và mã hóa.
Mô hình S1, cùng với tất cả các chi tiết ngon ngọt của dữ liệu và mã đào tạo của nó, hiện đã sẵn sàng để lấy trên GitHub. Nhóm nghiên cứu đã khởi động mọi thứ bằng một mô hình cơ sở chạy và sau đó đưa nó qua máy vắt với một kỹ thuật gọi là chưng cất. Quá trình này liên quan đến việc vắt sữa nước "lý luận" từ một mô hình AI khác bằng cách đào tạo các phản ứng của nó. Trong trường hợp này, S1 đã nhận được thông minh từ mô hình thử nghiệm suy nghĩ Flash Song Gemini 2.0 của Google. Đó là một chiến thuật tương tự như những gì các nhà nghiên cứu Berkeley đã sử dụng để đánh dấu mô hình lý luận AI của riêng họ với giá khoảng 450 đô la chỉ tháng trước.
Đối với một số người, ý tưởng rằng một nhóm nhỏ các nhà nghiên cứu vẫn có thể tạo ra sóng trong lĩnh vực AI mà không có ngân sách lớn là ly kỳ. Nhưng sự xuất hiện của S1 cũng gây ra một số câu hỏi nghiêm trọng về tương lai của sự phát triển mô hình AI. Nếu một mô hình đối thủ với những người được xây dựng với hàng triệu người có thể được nhân rộng trên ngân sách đóng băng, thì điều gì sẽ ngăn mọi người làm điều tương tự?
Không có gì đáng ngạc nhiên, những người chơi lớn trong AI không hồi hộp. Chẳng hạn, Openai đã chỉ tay vào Deepseek, cáo buộc họ sử dụng dữ liệu API của họ để nhiên liệu chưng cất mô hình. Trong khi đó, nhóm S1 đã tập trung vào việc tìm ra cách đơn giản nhất để đạt được hiệu suất lý luận vững chắc và một cái gì đó gọi là "tỷ lệ thời gian thử nghiệm", trong đó mô hình AI có nhiều thời gian hơn để suy nghĩ trước khi trả lời. Đây là những đổi mới tương tự mà mô hình O1 của Openai đã mang đến bàn, mà những người khác như Deepseek đã cố gắng bắt chước với các phương pháp của riêng họ.
Bài viết S1 cho rằng bạn có thể chắt lọc các mô hình lý luận với một bộ dữ liệu tương đối nhỏ bằng cách sử dụng một kỹ thuật được gọi là tinh chỉnh được giám sát (SFT). Điều này liên quan đến việc đào tạo mô hình AI để sao chép các hành vi cụ thể từ bộ dữ liệu và nó rẻ hơn so với việc học củng cố quy mô lớn mà Deepseek sử dụng cho mô hình R1 của họ, cạnh tranh với O1 của Openai.
Google làm cho Gemini 2.0 Flash Suy nghĩ Thử nghiệm có sẵn miễn phí thông qua nền tảng Google AI Studio của mình, mặc dù với giới hạn hàng ngày. Nhưng có một điều khoản bắt của các thuật ngữ của Google không cho phép các mô hình kỹ thuật đảo ngược tạo ra các dịch vụ cạnh tranh. Chúng tôi đang chờ đợi để nghe lại từ Google về điều này.
Bản thân mô hình S1 đã bắt đầu cuộc sống như một mô hình AI khiêm tốn, ngoài luồng từ phòng thí nghiệm Qwen của Alibaba, mà bất cứ ai cũng có thể tải xuống miễn phí. Để đào tạo S1, các nhà nghiên cứu đã đưa ra một bộ dữ liệu chỉ có 1.000 câu hỏi được lựa chọn cẩn thận, cùng với câu trả lời và quá trình "suy nghĩ" đằng sau mỗi câu hỏi, nhờ sự giúp đỡ của Gemini 2.0 của Google. Toàn bộ quá trình đào tạo chỉ mất chưa đến 30 phút trên 16 GPU NVIDIA H100. Theo Niklas Muennighoff, một nhà nghiên cứu của Stanford tham gia vào dự án, bạn có thể thực hiện điều này ngày hôm nay với giá khoảng 20 đô la chi phí tính toán.
Các nhà nghiên cứu cũng đã thực hiện một động thái thông minh để thực hiện kiểm tra kỹ tác phẩm của S1 và mở rộng thời gian "suy nghĩ" của mình, họ chỉ đơn giản bảo nó "chờ đợi". Thêm từ này trong quá trình lý luận của S1 đã giúp nó đưa ra câu trả lời chính xác hơn một chút, theo bài báo.
Nhìn về phía trước đến năm 2025, những người khổng lồ công nghệ như Meta, Google và Microsoft được thiết lập để đổ hàng trăm tỷ vào cơ sở hạ tầng AI, phần lớn sẽ hướng tới việc đào tạo làn sóng tiếp theo của các mô hình AI. Mặc dù chưng cất chứng tỏ là một cách hiệu quả để tái tạo các khả năng AI với giá rẻ, nhưng nó sẽ không dẫn đến việc tạo ra các mô hình AI hoàn toàn mới, đột phá bất cứ lúc nào sớm.
Bài viết liên quan
OpenAI升級其Operator Agent的AI模型
OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準
為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權
Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
Nhận xét (5)
0/200
HarryRoberts
00:00:00 GMT Ngày 23 tháng 4 năm 2025
This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀
0
DonaldGonzález
00:00:00 GMT Ngày 23 tháng 4 năm 2025
s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀
0
GregoryAdams
00:00:00 GMT Ngày 22 tháng 4 năm 2025
s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀
0
JackPerez
00:00:00 GMT Ngày 21 tháng 4 năm 2025
O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀
0
HenryWalker
00:00:00 GMT Ngày 23 tháng 4 năm 2025
Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀
0
Thứ Sáu tuần trước, một bài báo nghiên cứu đột phá từ các chuyên gia AI tại Stanford và Đại học Washington đã xuất hiện, tiết lộ rằng họ đã phát triển một mô hình "Lý luận" AI, được đặt tên là S1, với giá dưới 50 đô la trong các khoản tín dụng tính toán đám mây. Sự tiết lộ này đang làm rung chuyển thế giới AI, vì S1 giữ chính nó chống lại các mô hình hàng đầu như O1 và Deepseek's R1 khi nói đến việc giải quyết các thử thách toán học và mã hóa.
Mô hình S1, cùng với tất cả các chi tiết ngon ngọt của dữ liệu và mã đào tạo của nó, hiện đã sẵn sàng để lấy trên GitHub. Nhóm nghiên cứu đã khởi động mọi thứ bằng một mô hình cơ sở chạy và sau đó đưa nó qua máy vắt với một kỹ thuật gọi là chưng cất. Quá trình này liên quan đến việc vắt sữa nước "lý luận" từ một mô hình AI khác bằng cách đào tạo các phản ứng của nó. Trong trường hợp này, S1 đã nhận được thông minh từ mô hình thử nghiệm suy nghĩ Flash Song Gemini 2.0 của Google. Đó là một chiến thuật tương tự như những gì các nhà nghiên cứu Berkeley đã sử dụng để đánh dấu mô hình lý luận AI của riêng họ với giá khoảng 450 đô la chỉ tháng trước.
Đối với một số người, ý tưởng rằng một nhóm nhỏ các nhà nghiên cứu vẫn có thể tạo ra sóng trong lĩnh vực AI mà không có ngân sách lớn là ly kỳ. Nhưng sự xuất hiện của S1 cũng gây ra một số câu hỏi nghiêm trọng về tương lai của sự phát triển mô hình AI. Nếu một mô hình đối thủ với những người được xây dựng với hàng triệu người có thể được nhân rộng trên ngân sách đóng băng, thì điều gì sẽ ngăn mọi người làm điều tương tự?
Không có gì đáng ngạc nhiên, những người chơi lớn trong AI không hồi hộp. Chẳng hạn, Openai đã chỉ tay vào Deepseek, cáo buộc họ sử dụng dữ liệu API của họ để nhiên liệu chưng cất mô hình. Trong khi đó, nhóm S1 đã tập trung vào việc tìm ra cách đơn giản nhất để đạt được hiệu suất lý luận vững chắc và một cái gì đó gọi là "tỷ lệ thời gian thử nghiệm", trong đó mô hình AI có nhiều thời gian hơn để suy nghĩ trước khi trả lời. Đây là những đổi mới tương tự mà mô hình O1 của Openai đã mang đến bàn, mà những người khác như Deepseek đã cố gắng bắt chước với các phương pháp của riêng họ.
Bài viết S1 cho rằng bạn có thể chắt lọc các mô hình lý luận với một bộ dữ liệu tương đối nhỏ bằng cách sử dụng một kỹ thuật được gọi là tinh chỉnh được giám sát (SFT). Điều này liên quan đến việc đào tạo mô hình AI để sao chép các hành vi cụ thể từ bộ dữ liệu và nó rẻ hơn so với việc học củng cố quy mô lớn mà Deepseek sử dụng cho mô hình R1 của họ, cạnh tranh với O1 của Openai.
Google làm cho Gemini 2.0 Flash Suy nghĩ Thử nghiệm có sẵn miễn phí thông qua nền tảng Google AI Studio của mình, mặc dù với giới hạn hàng ngày. Nhưng có một điều khoản bắt của các thuật ngữ của Google không cho phép các mô hình kỹ thuật đảo ngược tạo ra các dịch vụ cạnh tranh. Chúng tôi đang chờ đợi để nghe lại từ Google về điều này.
Bản thân mô hình S1 đã bắt đầu cuộc sống như một mô hình AI khiêm tốn, ngoài luồng từ phòng thí nghiệm Qwen của Alibaba, mà bất cứ ai cũng có thể tải xuống miễn phí. Để đào tạo S1, các nhà nghiên cứu đã đưa ra một bộ dữ liệu chỉ có 1.000 câu hỏi được lựa chọn cẩn thận, cùng với câu trả lời và quá trình "suy nghĩ" đằng sau mỗi câu hỏi, nhờ sự giúp đỡ của Gemini 2.0 của Google. Toàn bộ quá trình đào tạo chỉ mất chưa đến 30 phút trên 16 GPU NVIDIA H100. Theo Niklas Muennighoff, một nhà nghiên cứu của Stanford tham gia vào dự án, bạn có thể thực hiện điều này ngày hôm nay với giá khoảng 20 đô la chi phí tính toán.
Các nhà nghiên cứu cũng đã thực hiện một động thái thông minh để thực hiện kiểm tra kỹ tác phẩm của S1 và mở rộng thời gian "suy nghĩ" của mình, họ chỉ đơn giản bảo nó "chờ đợi". Thêm từ này trong quá trình lý luận của S1 đã giúp nó đưa ra câu trả lời chính xác hơn một chút, theo bài báo.
Nhìn về phía trước đến năm 2025, những người khổng lồ công nghệ như Meta, Google và Microsoft được thiết lập để đổ hàng trăm tỷ vào cơ sở hạ tầng AI, phần lớn sẽ hướng tới việc đào tạo làn sóng tiếp theo của các mô hình AI. Mặc dù chưng cất chứng tỏ là một cách hiệu quả để tái tạo các khả năng AI với giá rẻ, nhưng nó sẽ không dẫn đến việc tạo ra các mô hình AI hoàn toàn mới, đột phá bất cứ lúc nào sớm.




This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀




s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀




s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀




O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀




Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀












