研究人員以低於50美元的價格開發了OpenAI $ 50“推理”模型的開源競爭對手

上週五,來自史丹佛大學與華盛頓大學的AI專家發表了一篇突破性研究論文,揭示他們以不到50美元的雲端運算費用,成功開發出一款名為s1的AI「推理」模型。這一發現震撼了AI界,因為s1在應對數學和程式設計挑戰時,能與OpenAI的o1和DeepSeek的R1等頂尖模型匹敵。
s1模型及其訓練數據和程式碼的詳細內容現已在GitHub上公開。研究團隊從一個普通的基礎模型開始,採用一種名為蒸餾的技術進行強化。此過程涉及從另一個AI模型的回應中萃取「推理」能力進行訓練。在本例中,s1的智慧來自Google的Gemini 2.0 Flash Thinking Experimental模型。這與柏克萊研究人員上個月用大約450美元打造自家AI推理模型的策略類似。
對某些人來說,一個小型研究團隊能在無需巨額預算的情況下,在AI領域掀起波瀾,令人振奮。但s1的出現也引發了關於AI模型發展未來的嚴肅問題。如果一個能與耗資數百萬打造的模型媲美的模型,可以用極低的預算複製出來,還有什麼能阻止其他人做同樣的事呢?
不出所料,AI領域的大廠對此並不樂見。例如,OpenAI曾指責DeepSeek利用其API數據進行模型蒸餾。與此同時,s1團隊專注於尋找最直接的方法,以實現穩健的推理性能和所謂的「測試時擴展」(test-time scaling),即讓AI模型在回答前有更多思考時間。這與OpenAI的o1模型帶來的創新相同,而DeepSeek等其他團隊也試圖以自己的方式模仿。
s1論文指出,透過一種稱為監督微調(SFT)的技術,可以用相對較小的數據集來蒸餾推理模型。這涉及訓練AI模型從數據集中複製特定行為,成本比DeepSeek用於其R1模型的大規模強化學習低,後者與OpenAI的o1競爭。
Google透過其Google AI Studio平台免費提供Gemini 2.0 Flash Thinking Experimental,但有每日使用限制。然而,問題在於Google的條款不允許逆向工程其模型以創建競爭服務。我們正在等待Google的回應。
s1模型本身最初是來自阿里巴巴Qwen實驗室的普通現成AI模型,任何人都可以免費下載。為訓練s1,研究人員準備了一個僅包含1,000個精心挑選問題的數據集,連同答案及每個問題背後的「思考」過程,這些都來自Google的Gemini 2.0。整個訓練過程在16個Nvidia H100 GPU上耗時不到30分鐘。根據參與項目的史丹佛研究員Niklas Muennighoff表示,如今這項工作只需約20美元的運算成本即可完成。
研究人員還採取了一個巧妙的策略,讓s1檢查自己的工作並延長其「思考」時間——他們僅僅是告訴它「等待」。論文指出,在s1的推理過程中加入這個詞,有助於它給出略為更準確的答案。
展望2025年,像Meta、Google和Microsoft這樣的科技巨頭計劃投入數千億美元於AI基礎設施,其中大部分將用於訓練下一波AI模型。雖然蒸餾被證明是低成本重現AI能力的有效方式,但短期內不會催生全新、突破性的AI模型。
相關文章
Google 揭曉量產級 Gemini 2.5 AI 模型以在企業市場與 OpenAI 競爭
Google 於週一強化其 AI 策略,推出先進的 Gemini 2.5 模型供企業使用,並引入成本效益高的變體,以在價格與性能上競爭。Alphabet 旗下的公司將其旗艦 AI 模型—Gemini 2.5 Pro 與 Gemini 2.5 Flash—從測試階段提升至全面可用,展示其適用於關鍵業務應用的準備度。同時,Google 推出 Gemini 2.5 Flash-Lite,定位為高量任務中
Meta為AI人才提供高薪,否認1億美元簽約獎金
Meta以數百萬美元的薪酬套餐吸引AI研究人員加入其新超級智能實驗室。然而,一位受聘研究員及洩露的內部會議內容顯示,1億美元「簽約獎金」的說法不實。據The Verge週四報導,在一場洩露的公司全體會議中,Meta高管回應了關於OpenAI執行長Sam Altman聲稱Meta向頂尖研究員提供獎金的問題。Meta技術長Andrew Bosworth表示,只有極少數高級領導可能獲得如此高額報酬,但澄
OpenAI行銷主管因乳癌治療請假
Kate Rouch,OpenAI的行銷領導者,將請假三個月以專注於侵襲性乳癌的治療。在LinkedIn的貼文中,Rouch宣布前Meta行銷長Gary Briggs將在她缺席期間擔任臨時行銷主管。“今年剛進入我夢寐以求的角色幾週後,我被診斷出患有侵襲性乳癌,”Rouch分享道。“過去五個月,我一邊在UCSF接受化療,一邊領導我們的行銷團隊。這是我、我的丈夫和我們兩個年幼的孩子最艱難的一章。”Ro
評論 (7)
0/200
StevenWilson
2025-08-08 17:00:59
Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔
0
BenRoberts
2025-08-01 10:48:18
Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀
0
DonaldGonzález
2025-04-23 07:45:55
s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀
0
HarryRoberts
2025-04-23 06:38:34
This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀
0
HenryWalker
2025-04-23 06:34:07
Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀
0
GregoryAdams
2025-04-22 22:19:22
s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀
0
上週五,來自史丹佛大學與華盛頓大學的AI專家發表了一篇突破性研究論文,揭示他們以不到50美元的雲端運算費用,成功開發出一款名為s1的AI「推理」模型。這一發現震撼了AI界,因為s1在應對數學和程式設計挑戰時,能與OpenAI的o1和DeepSeek的R1等頂尖模型匹敵。
s1模型及其訓練數據和程式碼的詳細內容現已在GitHub上公開。研究團隊從一個普通的基礎模型開始,採用一種名為蒸餾的技術進行強化。此過程涉及從另一個AI模型的回應中萃取「推理」能力進行訓練。在本例中,s1的智慧來自Google的Gemini 2.0 Flash Thinking Experimental模型。這與柏克萊研究人員上個月用大約450美元打造自家AI推理模型的策略類似。
對某些人來說,一個小型研究團隊能在無需巨額預算的情況下,在AI領域掀起波瀾,令人振奮。但s1的出現也引發了關於AI模型發展未來的嚴肅問題。如果一個能與耗資數百萬打造的模型媲美的模型,可以用極低的預算複製出來,還有什麼能阻止其他人做同樣的事呢?
不出所料,AI領域的大廠對此並不樂見。例如,OpenAI曾指責DeepSeek利用其API數據進行模型蒸餾。與此同時,s1團隊專注於尋找最直接的方法,以實現穩健的推理性能和所謂的「測試時擴展」(test-time scaling),即讓AI模型在回答前有更多思考時間。這與OpenAI的o1模型帶來的創新相同,而DeepSeek等其他團隊也試圖以自己的方式模仿。
s1論文指出,透過一種稱為監督微調(SFT)的技術,可以用相對較小的數據集來蒸餾推理模型。這涉及訓練AI模型從數據集中複製特定行為,成本比DeepSeek用於其R1模型的大規模強化學習低,後者與OpenAI的o1競爭。
Google透過其Google AI Studio平台免費提供Gemini 2.0 Flash Thinking Experimental,但有每日使用限制。然而,問題在於Google的條款不允許逆向工程其模型以創建競爭服務。我們正在等待Google的回應。
s1模型本身最初是來自阿里巴巴Qwen實驗室的普通現成AI模型,任何人都可以免費下載。為訓練s1,研究人員準備了一個僅包含1,000個精心挑選問題的數據集,連同答案及每個問題背後的「思考」過程,這些都來自Google的Gemini 2.0。整個訓練過程在16個Nvidia H100 GPU上耗時不到30分鐘。根據參與項目的史丹佛研究員Niklas Muennighoff表示,如今這項工作只需約20美元的運算成本即可完成。
研究人員還採取了一個巧妙的策略,讓s1檢查自己的工作並延長其「思考」時間——他們僅僅是告訴它「等待」。論文指出,在s1的推理過程中加入這個詞,有助於它給出略為更準確的答案。
展望2025年,像Meta、Google和Microsoft這樣的科技巨頭計劃投入數千億美元於AI基礎設施,其中大部分將用於訓練下一波AI模型。雖然蒸餾被證明是低成本重現AI能力的有效方式,但短期內不會催生全新、突破性的AI模型。



Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔




Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀




s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀




This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀




Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀




s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀












