Forscher entwickeln einen Open-Source

Am vergangenen Freitag traf ein bahnbrechender Forschungspapier von KI -Experten in Stanford und der University of Washington in die Szene, in der sie enthüllten, dass sie es geschafft haben, ein KI -Modell "Argumenting" mit dem Namen S1 für weniger als 50 US -Dollar in Cloud -Computer -Credits zu entwickeln. Diese Offenbarung schüttelt die KI-Welt, da sich S1 gegen Top-Tier-Modelle wie Openai's O1 und Deepseeks R1 in der Lage ist, Mathematik- und Codierungsherausforderungen anzugehen.
Das S1 -Modell ist zusammen mit allen saftigen Details seiner Trainingsdaten und des Code zu Github zugänglich. Das Team startete die Dinge mit einem gewöhnlichen Basismodell und setzte es dann mit einer Technik namens Destillation durch den Wringer. Dieser Prozess beinhaltet das Ausdrücken des "Argumentationssaftes" aus einem anderen KI -Modell, indem er die Antworten trainiert. In diesem Fall erhielt S1 seine Smarts vom Google Gemini 2.0 Flash Thinking Experimental Model. Es ist eine ähnliche Taktik wie in Berkeley -Forschern, um ihr eigenes KI -Argumentationsmodell für rund 450 US -Dollar erst letzten Monat aufzuschlagen.
Für einige ist die Idee, dass ein kleines Team von Forschern im KI -Bereich immer noch Wellen ohne ein massives Budget machen kann. Das Auftauchen von S1 stellt jedoch auch einige ernsthafte Fragen zur Zukunft der KI -Modellentwicklung aus. Wenn ein Modell, das mit Millionen konkurrierenden Konkurrenz auf einem Schuhbudget repliziert werden kann, dann alle davon abhalten, dasselbe zu tun?
Es überrascht nicht, dass die großen Spieler in der KI nicht begeistert sind. OpenAI hat beispielsweise die Finger auf Deepseek gezeigt und sie beschuldigt, ihre API -Daten zur Destillation des Modells zu verwenden. In der Zwischenzeit konzentrierte sich das S1-Team darauf, die unkomplizierteste Möglichkeit zu finden, um eine solide Argumentationsleistung und eine sogenannte "Testzeitskalierung" zu erzielen, bei der ein KI-Modell vor der Beantwortung mehr Zeit zum Nachdenken hat. Dies sind die gleichen Innovationen, die das O1 -Modell von Openai auf den Tisch gebracht hat, was andere wie Deepseek versucht haben, mit ihren eigenen Methoden nachzuahmen.
Das S1-Papier schlägt vor, dass Sie Argumentationsmodelle mit einem relativ kleinen Datensatz unter Verwendung einer Technik destillieren können, die als beaufsichtigte Feinabstimmung (SFT) bezeichnet wird. Dies beinhaltet das Training des KI-Modells, um spezifische Verhaltensweisen aus einem Datensatz zu kopieren, und es ist billiger als das groß angelegte Verstärkungslernen, das Deepseek für ihr R1-Modell verwendet hat, das mit OpenAs O1 konkurriert.
Google stellt Gemini 2.0 Flash Thinking experimentell kostenlos über seine Google AI Studio -Plattform zur Verfügung, jedoch mit täglichen Grenzen. Aber es gibt einen Haken-die Begriffe von Google lassen seine Modelle nicht umgekehrt, um konkurrierende Dienste zu schaffen. Wir warten darauf, von Google davon zu hören.
Das S1-Modell selbst begann das Leben als bescheidenes AI-Modell von Alibabas Qwen Lab, das jeder kostenlos herunterladen kann. Um S1 auszubilden, stellten die Forscher einen Datensatz von nur 1.000 sorgfältig ausgewählten Fragen zusammen mit Antworten und dem "Denken" -Prozess hinter jedem einzelnen mit freundlicher Genehmigung von Googles Gemini 2.0 zusammen. Der gesamte Trainingsprozess dauerte weniger als 30 Minuten bei 16 Nvidia H100 GPU. Laut Niklas Muennighoff, einem an dem Projekt beteiligten Stanford -Forscher, könnten Sie dies heute für rund 20 US -Dollar an Berechnungspunkten schaffen.
Die Forscher machten auch einen klugen Schritt, um S1 ihre Arbeit zu überprüfen und seine "Denken" -Zeit zu verlängern-sie sagten es einfach, "zu warten". Das Hinzufügen dieses Wortes während des Argumentationsprozesses von S1 half es, laut dem Papier etwas genauere Antworten zu erhalten.
Mit Blick auf 2025 werden Tech -Giganten wie Meta, Google und Microsoft Hunderte von Milliarden in die KI -Infrastruktur einfließen, von denen ein Großteil für die Schulung der nächsten Welle von AI -Modellen fließt. Während sich die Destillation als effektive Möglichkeit erweist, KI-Fähigkeiten billig nachzubilden, wird sie nicht so bald zur Schaffung brandneuer, bahnbrechenden KI-Models führen.
Verwandter Artikel
OpenAI升級其Operator Agent的AI模型
OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準
為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權
Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
Kommentare (5)
0/200
HarryRoberts
23. April 2025 00:00:00 GMT
This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀
0
DonaldGonzález
23. April 2025 00:00:00 GMT
s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀
0
GregoryAdams
22. April 2025 00:00:00 GMT
s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀
0
JackPerez
21. April 2025 00:00:00 GMT
O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀
0
HenryWalker
23. April 2025 00:00:00 GMT
Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀
0
Am vergangenen Freitag traf ein bahnbrechender Forschungspapier von KI -Experten in Stanford und der University of Washington in die Szene, in der sie enthüllten, dass sie es geschafft haben, ein KI -Modell "Argumenting" mit dem Namen S1 für weniger als 50 US -Dollar in Cloud -Computer -Credits zu entwickeln. Diese Offenbarung schüttelt die KI-Welt, da sich S1 gegen Top-Tier-Modelle wie Openai's O1 und Deepseeks R1 in der Lage ist, Mathematik- und Codierungsherausforderungen anzugehen.
Das S1 -Modell ist zusammen mit allen saftigen Details seiner Trainingsdaten und des Code zu Github zugänglich. Das Team startete die Dinge mit einem gewöhnlichen Basismodell und setzte es dann mit einer Technik namens Destillation durch den Wringer. Dieser Prozess beinhaltet das Ausdrücken des "Argumentationssaftes" aus einem anderen KI -Modell, indem er die Antworten trainiert. In diesem Fall erhielt S1 seine Smarts vom Google Gemini 2.0 Flash Thinking Experimental Model. Es ist eine ähnliche Taktik wie in Berkeley -Forschern, um ihr eigenes KI -Argumentationsmodell für rund 450 US -Dollar erst letzten Monat aufzuschlagen.
Für einige ist die Idee, dass ein kleines Team von Forschern im KI -Bereich immer noch Wellen ohne ein massives Budget machen kann. Das Auftauchen von S1 stellt jedoch auch einige ernsthafte Fragen zur Zukunft der KI -Modellentwicklung aus. Wenn ein Modell, das mit Millionen konkurrierenden Konkurrenz auf einem Schuhbudget repliziert werden kann, dann alle davon abhalten, dasselbe zu tun?
Es überrascht nicht, dass die großen Spieler in der KI nicht begeistert sind. OpenAI hat beispielsweise die Finger auf Deepseek gezeigt und sie beschuldigt, ihre API -Daten zur Destillation des Modells zu verwenden. In der Zwischenzeit konzentrierte sich das S1-Team darauf, die unkomplizierteste Möglichkeit zu finden, um eine solide Argumentationsleistung und eine sogenannte "Testzeitskalierung" zu erzielen, bei der ein KI-Modell vor der Beantwortung mehr Zeit zum Nachdenken hat. Dies sind die gleichen Innovationen, die das O1 -Modell von Openai auf den Tisch gebracht hat, was andere wie Deepseek versucht haben, mit ihren eigenen Methoden nachzuahmen.
Das S1-Papier schlägt vor, dass Sie Argumentationsmodelle mit einem relativ kleinen Datensatz unter Verwendung einer Technik destillieren können, die als beaufsichtigte Feinabstimmung (SFT) bezeichnet wird. Dies beinhaltet das Training des KI-Modells, um spezifische Verhaltensweisen aus einem Datensatz zu kopieren, und es ist billiger als das groß angelegte Verstärkungslernen, das Deepseek für ihr R1-Modell verwendet hat, das mit OpenAs O1 konkurriert.
Google stellt Gemini 2.0 Flash Thinking experimentell kostenlos über seine Google AI Studio -Plattform zur Verfügung, jedoch mit täglichen Grenzen. Aber es gibt einen Haken-die Begriffe von Google lassen seine Modelle nicht umgekehrt, um konkurrierende Dienste zu schaffen. Wir warten darauf, von Google davon zu hören.
Das S1-Modell selbst begann das Leben als bescheidenes AI-Modell von Alibabas Qwen Lab, das jeder kostenlos herunterladen kann. Um S1 auszubilden, stellten die Forscher einen Datensatz von nur 1.000 sorgfältig ausgewählten Fragen zusammen mit Antworten und dem "Denken" -Prozess hinter jedem einzelnen mit freundlicher Genehmigung von Googles Gemini 2.0 zusammen. Der gesamte Trainingsprozess dauerte weniger als 30 Minuten bei 16 Nvidia H100 GPU. Laut Niklas Muennighoff, einem an dem Projekt beteiligten Stanford -Forscher, könnten Sie dies heute für rund 20 US -Dollar an Berechnungspunkten schaffen.
Die Forscher machten auch einen klugen Schritt, um S1 ihre Arbeit zu überprüfen und seine "Denken" -Zeit zu verlängern-sie sagten es einfach, "zu warten". Das Hinzufügen dieses Wortes während des Argumentationsprozesses von S1 half es, laut dem Papier etwas genauere Antworten zu erhalten.
Mit Blick auf 2025 werden Tech -Giganten wie Meta, Google und Microsoft Hunderte von Milliarden in die KI -Infrastruktur einfließen, von denen ein Großteil für die Schulung der nächsten Welle von AI -Modellen fließt. Während sich die Destillation als effektive Möglichkeit erweist, KI-Fähigkeiten billig nachzubilden, wird sie nicht so bald zur Schaffung brandneuer, bahnbrechenden KI-Models führen.




This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀




s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀




s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀




O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀




Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀












