研究人員以低於50美元的價格開發了OpenAI $ 50“推理”模型的開源競爭對手

上週五,來自史丹佛大學與華盛頓大學的AI專家發表了一篇突破性研究論文,揭示他們以不到50美元的雲端運算費用,成功開發出一款名為s1的AI「推理」模型。這一發現震撼了AI界,因為s1在應對數學和程式設計挑戰時,能與OpenAI的o1和DeepSeek的R1等頂尖模型匹敵。
s1模型及其訓練數據和程式碼的詳細內容現已在GitHub上公開。研究團隊從一個普通的基礎模型開始,採用一種名為蒸餾的技術進行強化。此過程涉及從另一個AI模型的回應中萃取「推理」能力進行訓練。在本例中,s1的智慧來自Google的Gemini 2.0 Flash Thinking Experimental模型。這與柏克萊研究人員上個月用大約450美元打造自家AI推理模型的策略類似。
對某些人來說,一個小型研究團隊能在無需巨額預算的情況下,在AI領域掀起波瀾,令人振奮。但s1的出現也引發了關於AI模型發展未來的嚴肅問題。如果一個能與耗資數百萬打造的模型媲美的模型,可以用極低的預算複製出來,還有什麼能阻止其他人做同樣的事呢?
不出所料,AI領域的大廠對此並不樂見。例如,OpenAI曾指責DeepSeek利用其API數據進行模型蒸餾。與此同時,s1團隊專注於尋找最直接的方法,以實現穩健的推理性能和所謂的「測試時擴展」(test-time scaling),即讓AI模型在回答前有更多思考時間。這與OpenAI的o1模型帶來的創新相同,而DeepSeek等其他團隊也試圖以自己的方式模仿。
s1論文指出,透過一種稱為監督微調(SFT)的技術,可以用相對較小的數據集來蒸餾推理模型。這涉及訓練AI模型從數據集中複製特定行為,成本比DeepSeek用於其R1模型的大規模強化學習低,後者與OpenAI的o1競爭。
Google透過其Google AI Studio平台免費提供Gemini 2.0 Flash Thinking Experimental,但有每日使用限制。然而,問題在於Google的條款不允許逆向工程其模型以創建競爭服務。我們正在等待Google的回應。
s1模型本身最初是來自阿里巴巴Qwen實驗室的普通現成AI模型,任何人都可以免費下載。為訓練s1,研究人員準備了一個僅包含1,000個精心挑選問題的數據集,連同答案及每個問題背後的「思考」過程,這些都來自Google的Gemini 2.0。整個訓練過程在16個Nvidia H100 GPU上耗時不到30分鐘。根據參與項目的史丹佛研究員Niklas Muennighoff表示,如今這項工作只需約20美元的運算成本即可完成。
研究人員還採取了一個巧妙的策略,讓s1檢查自己的工作並延長其「思考」時間——他們僅僅是告訴它「等待」。論文指出,在s1的推理過程中加入這個詞,有助於它給出略為更準確的答案。
展望2025年,像Meta、Google和Microsoft這樣的科技巨頭計劃投入數千億美元於AI基礎設施,其中大部分將用於訓練下一波AI模型。雖然蒸餾被證明是低成本重現AI能力的有效方式,但短期內不會催生全新、突破性的AI模型。
相關文章
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI
2017年8月下旬,OpenAI(當時還是一家小型非營利研究實驗室)的核心成員召開會議,商討如何成立營利實體以將其技術商業化,並籌集實現通用人工智慧(AGI)所需的資金。伊隆·馬斯克要求對公司擁有完全控制權,並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示,他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際,試圖用這份禮物來收買他們。 OpenAI的研
五角大樓與英偉達、微軟和亞馬遜網路服務公司簽訂了協議,以便在機密網路中部署人工智慧技術。
在此前與谷歌、SpaceX和OpenAI達成協議之後,美國國防部於週五宣佈,它現已與Nvidia、微軟、亞馬遜網路服務和Reflection AI簽訂了合同,這些公司將會將其人工智慧技術和模型部署在保密網路上,用於“合法的操作用途”。宣告中還指出:“這些協議加速了將美國軍隊建設成為以人工智慧為核心作戰力量的程序,並將增強我們的戰士在所有戰爭領域保持決策優勢的能力。”這些協議的簽署,正值五角大樓試圖在與Anthropic就使用條款發生爭議後,多元化其人工智慧供應商的選擇。五角大樓希望無限制地使
相關專題推薦
評論 (11)
0/500
스탠포드랑 워싱턴 대학 팀이 50달러 코스트로 만들어낸 s1 리서치, 진짜 충격이에요. 🤯 오픈소스 개발이랑 저비용 학습 실험 덕분에 AI 대중화가 더 가까워진 느낌인데, 저비용 고성능 모델이 점점 많아지면 AI 기술 격차도 줄어들까요?
Это просто невероятно! 🔥 Открытые модели вроде s1 могут полностью изменить правила игры в ИИ. Если команда из двух университетов смогла создать конкурента OpenAI за $50, представьте, что произойдет, когда такие инструменты станут доступны всем исследователям. Может, скоро увидим взрыв инноваций в малом бюджете? Правда, интересно, как это повлияет на бизнес-модели крупных компаний...
¡Qué pasada! Un modelo de razonamiento por menos de 50 dólares... La verdad es que demuestra cómo el código abierto puede cambiar las reglas del juego en IA. ¿Cuánto tiempo pasará antes que OpenAI tenga que bajar sus precios? 🔥
Это просто невероятно! 🚀 Создать аналог OpenAI за $50 — это настоящий прорыв. Интересно, какие возможности откроются для небольших стартапов и исследователей? Может, скоро мы увидим взлет новых AI-проектов без гигантских бюджетов.
Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔

上週五,來自史丹佛大學與華盛頓大學的AI專家發表了一篇突破性研究論文,揭示他們以不到50美元的雲端運算費用,成功開發出一款名為s1的AI「推理」模型。這一發現震撼了AI界,因為s1在應對數學和程式設計挑戰時,能與OpenAI的o1和DeepSeek的R1等頂尖模型匹敵。
s1模型及其訓練數據和程式碼的詳細內容現已在GitHub上公開。研究團隊從一個普通的基礎模型開始,採用一種名為蒸餾的技術進行強化。此過程涉及從另一個AI模型的回應中萃取「推理」能力進行訓練。在本例中,s1的智慧來自Google的Gemini 2.0 Flash Thinking Experimental模型。這與柏克萊研究人員上個月用大約450美元打造自家AI推理模型的策略類似。
對某些人來說,一個小型研究團隊能在無需巨額預算的情況下,在AI領域掀起波瀾,令人振奮。但s1的出現也引發了關於AI模型發展未來的嚴肅問題。如果一個能與耗資數百萬打造的模型媲美的模型,可以用極低的預算複製出來,還有什麼能阻止其他人做同樣的事呢?
不出所料,AI領域的大廠對此並不樂見。例如,OpenAI曾指責DeepSeek利用其API數據進行模型蒸餾。與此同時,s1團隊專注於尋找最直接的方法,以實現穩健的推理性能和所謂的「測試時擴展」(test-time scaling),即讓AI模型在回答前有更多思考時間。這與OpenAI的o1模型帶來的創新相同,而DeepSeek等其他團隊也試圖以自己的方式模仿。
s1論文指出,透過一種稱為監督微調(SFT)的技術,可以用相對較小的數據集來蒸餾推理模型。這涉及訓練AI模型從數據集中複製特定行為,成本比DeepSeek用於其R1模型的大規模強化學習低,後者與OpenAI的o1競爭。
Google透過其Google AI Studio平台免費提供Gemini 2.0 Flash Thinking Experimental,但有每日使用限制。然而,問題在於Google的條款不允許逆向工程其模型以創建競爭服務。我們正在等待Google的回應。
s1模型本身最初是來自阿里巴巴Qwen實驗室的普通現成AI模型,任何人都可以免費下載。為訓練s1,研究人員準備了一個僅包含1,000個精心挑選問題的數據集,連同答案及每個問題背後的「思考」過程,這些都來自Google的Gemini 2.0。整個訓練過程在16個Nvidia H100 GPU上耗時不到30分鐘。根據參與項目的史丹佛研究員Niklas Muennighoff表示,如今這項工作只需約20美元的運算成本即可完成。
研究人員還採取了一個巧妙的策略,讓s1檢查自己的工作並延長其「思考」時間——他們僅僅是告訴它「等待」。論文指出,在s1的推理過程中加入這個詞,有助於它給出略為更準確的答案。
展望2025年,像Meta、Google和Microsoft這樣的科技巨頭計劃投入數千億美元於AI基礎設施,其中大部分將用於訓練下一波AI模型。雖然蒸餾被證明是低成本重現AI能力的有效方式,但短期內不會催生全新、突破性的AI模型。
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI
2017年8月下旬,OpenAI(當時還是一家小型非營利研究實驗室)的核心成員召開會議,商討如何成立營利實體以將其技術商業化,並籌集實現通用人工智慧(AGI)所需的資金。伊隆·馬斯克要求對公司擁有完全控制權,並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示,他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際,試圖用這份禮物來收買他們。 OpenAI的研
五角大樓與英偉達、微軟和亞馬遜網路服務公司簽訂了協議,以便在機密網路中部署人工智慧技術。
在此前與谷歌、SpaceX和OpenAI達成協議之後,美國國防部於週五宣佈,它現已與Nvidia、微軟、亞馬遜網路服務和Reflection AI簽訂了合同,這些公司將會將其人工智慧技術和模型部署在保密網路上,用於“合法的操作用途”。宣告中還指出:“這些協議加速了將美國軍隊建設成為以人工智慧為核心作戰力量的程序,並將增強我們的戰士在所有戰爭領域保持決策優勢的能力。”這些協議的簽署,正值五角大樓試圖在與Anthropic就使用條款發生爭議後,多元化其人工智慧供應商的選擇。五角大樓希望無限制地使
스탠포드랑 워싱턴 대학 팀이 50달러 코스트로 만들어낸 s1 리서치, 진짜 충격이에요. 🤯 오픈소스 개발이랑 저비용 학습 실험 덕분에 AI 대중화가 더 가까워진 느낌인데, 저비용 고성능 모델이 점점 많아지면 AI 기술 격차도 줄어들까요?
Это просто невероятно! 🔥 Открытые модели вроде s1 могут полностью изменить правила игры в ИИ. Если команда из двух университетов смогла создать конкурента OpenAI за $50, представьте, что произойдет, когда такие инструменты станут доступны всем исследователям. Может, скоро увидим взрыв инноваций в малом бюджете? Правда, интересно, как это повлияет на бизнес-модели крупных компаний...
¡Qué pasada! Un modelo de razonamiento por menos de 50 dólares... La verdad es que demuestra cómo el código abierto puede cambiar las reglas del juego en IA. ¿Cuánto tiempo pasará antes que OpenAI tenga que bajar sus precios? 🔥
Это просто невероятно! 🚀 Создать аналог OpenAI за $50 — это настоящий прорыв. Интересно, какие возможности откроются для небольших стартапов и исследователей? Может, скоро мы увидим взлет новых AI-проектов без гигантских бюджетов.
Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔





首頁






