研究者は、50ドル未満のOpenaiの50ドルの「推論」モデルのオープンソースのライバルを開発します

家

ニュース

2025年4月21日

JosephWalker

# openai # DeepSeek

研究者は、50ドル未満のOpenaiの50ドルの「推論」モデルのオープンソースのライバルを開発します

先週の金曜日、スタンフォード大学とワシントン大学のAI専門家の画期的な研究論文が現場に登場し、Cloud Compute Creditsで50ドル未満のAI「推論」モデルを開発できたことが明らかになりました。 S1は、S1が数学とコーディングの課題に取り組むことに関して、OpenaiのO1やDeepseekのR1などのトップティアモデルに対して独自のものを保持しているため、AIの世界を揺さぶっています。

S1モデルは、トレーニングデータとコードのすべてのジューシーな詳細とともに、GitHubでグラブを作成しています。チームは、Mill-of-The-Millのベースモデルで物事をキックオフし、蒸留と呼ばれるテクニックでWringerを通過しました。このプロセスには、その応答をトレーニングすることにより、別のAIモデルから「推論」ジュースを絞り出すことが含まれます。この場合、S1はGoogleのGemini 2.0 Flash Thinking Experimental Modelからスマートを得ました。これは、バークレーの研究者が先月約450ドルで独自のAI推論モデルをホイップするために使用したものと同様の戦術です。

一部の人にとって、研究者の小さなチームがまだ大規模な予算なしでAI分野で波を作ることができるという考えはスリリングです。しかし、S1の出現はまた、AIモデル開発の将来に関するいくつかの深刻な質問を引き起こします。数百万人で構築されたモデルに匹敵するモデルが靴ひもの予算で再現できる場合、誰もが同じことをするのを止めるものは何ですか？

当然のことながら、AIの大手プレーヤーは興奮していません。たとえば、Openaiは、Deepseekに指を指しており、APIデータを使用してモデルの蒸留を燃料とすると非難しています。一方、S1チームは、堅実な推論パフォーマンスと「テスト時間スケーリング」と呼ばれる最も簡単な方法を見つけることに焦点を当てていました。これらは、OpenaiのO1モデルがテーブルにもたらしたのと同じ革新であり、Deepseekのような他の人が独自の方法で模倣しようとしたものです。

S1ペーパーは、監視された微調整（SFT）として知られる手法を使用して、比較的小さなデータセットで推論モデルを蒸留できることを示唆しています。これには、データセットから特定の動作をコピーするためにAIモデルをトレーニングすることが含まれます。これは、DeepSeekがOpenAIのO1と競合するR1モデルに使用される大規模な強化学習よりも安いです。

Googleは、Google AI Studio Platformを通じて無料で利用できるGemini 2.0 Flash Thinking Experimentalを使用できるようにしますが、毎日の制限があります。しかし、キャッチがあります。Googleの用語は、モデルをリバースエンジニアリングして競合するサービスを作成することを許可しません。これについてGoogleから返事を待っています。

S1モデル自体は、AlibabaのQwen Labの控えめな既製のAIモデルとして生活を始めました。これは誰でも無料でダウンロードできます。 S1を訓練するために、研究者は、GoogleのGemini 2.0の厚意により、回答と「思考」プロセスとともに、わずか1,000の慎重に選択された質問のデータセットをまとめました。トレーニングプロセス全体は、16 NVIDIA H100 GPUで30分未満かかりました。このプロジェクトに関与しているスタンフォード大学の研究者であるNiklas Muennighoffによると、これを約20ドルの計算費用で今日これを引き離すことができます。

研究者たちはまた、S1が仕事をダブルチェックし、その「思考」時間を延長するために巧妙な動きを引いた。彼らは単に「待つ」ように言った。 S1の推論プロセス中にこの単語を追加すると、論文によると、少し正確な回答が得られました。

2025年を楽しみにして、Meta、Google、Microsoftなどのハイテク大手は、数千億をAIインフラストラクチャに注ぐように設定されています。蒸留は、安価でAI機能を再現する効果的な方法であることが証明されていますが、すぐに新しく、画期的なAIモデルの作成につながることはありません。

OpenAI升級其Operator Agent的AI模型 OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構，這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動，但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面，o3幾乎在所有指標上都超越前

OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準為什麼 AI 基準測試的差異很重要？提到 AI 時，數字往往能說明一切——有時，這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆：據報導，o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考，競爭對手還停留在個位數。但隨著近期的發展，受人尊敬的研究機構 Epoch

Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波，Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導，該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容，製作了其作品的「精確副本」。這是截

コメント (5)

0/200

提出する

HarryRoberts

2025年4月23日 0:00:00 GMT

This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀

DonaldGonzález

2025年4月23日 0:00:00 GMT

s1モデルが50ドル未満で開発されたなんて信じられない！OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい！🚀

GregoryAdams

2025年4月22日 0:00:00 GMT

s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀

JackPerez

2025年4月21日 0:00:00 GMT

O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀

HenryWalker

2025年4月23日 0:00:00 GMT

Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀

トップニュース

Openaiは、より良いチャットのためにAIの音声アシスタントを強化します AI搭載のI/Oクロスワードを体験する：古典的な単語ゲームのモダンなひねり 2026年までに複数のNYCのパワーを消費するAIコンピューティングは、創設者によると Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します Nvidia CEOは、Deepseekの市場への影響に関する誤解を明確にしています韓国は地元の店舗でDeepseekアプリのダウンロードを停止しています Adobeが10の専門AIエージェントを発表する：彼らのビジネスアプリケーションを発見する ChatGptのエネルギー使用は、予想よりも低くなります OpenaiのO3モデルは、当初考えられていたよりも操作に潜在的に高価です Notebooklmは、Webソースの発見機能を追加します

もっと

特集