Les chercheurs développent un rival open source au modèle de «raisonnement» de 50 $ d'Openai pour moins de 50 $

Maison

Nouvelles

21 avril 2025

JosephWalker

# openai # DeepSeek

Les chercheurs développent un rival open source au modèle de «raisonnement» de 50 $ d'Openai pour moins de 50 $

Vendredi dernier, un document de recherche révolutionnaire des experts de l'IA à Stanford et de l'Université de Washington est entré en scène, révélant qu'ils ont réussi à développer un modèle de "raisonnement" de l'IA, surnommé S1, pour moins de 50 $ en crédits de calcul cloud. Cette révélation ébranle le monde de l'IA, car S1 se tient contre des modèles de haut niveau comme l'O1 d'Openai et le R1 de Deepseek lorsqu'il s'agit de relever les mathématiques et de coder les défis.

Le modèle S1, ainsi que tous les détails juteux de ses données de formation et de son code, est maintenant à gagner sur GitHub. L'équipe a lancé les choses avec un modèle de base banal et l'a ensuite mis à l'essoreuse avec une technique appelée distillation. Ce processus consiste à supprimer le jus de "raisonnement" d'un autre modèle d'IA en s'entraînant sur ses réponses. Dans ce cas, S1 a obtenu son intelligence du modèle expérimental Gemini 2.0 Flash Thinking de Google. C'est une tactique similaire à ce que les chercheurs de Berkeley ont utilisé pour préparer leur propre modèle de raisonnement en IA pour environ 450 $ le mois dernier.

Pour certains, l'idée qu'une petite équipe de chercheurs peut encore faire des vagues dans le domaine de l'IA sans budget massif est passionnant. Mais l'émergence de S1 déclenche également de sérieuses questions sur l'avenir du développement du modèle d'IA. Si un modèle qui rivalise avec ceux construits avec des millions peut être reproduit avec un budget de buté, qu'est-ce qui empêche tout le monde de faire de même?

Sans surprise, les grands acteurs de l'IA ne sont pas ravis. OpenAI, par exemple, a pointé des doigts sur Deepseek, les accusant d'utiliser leurs données API pour alimenter la distillation du modèle. Pendant ce temps, l'équipe S1 s'est concentrée sur la recherche du moyen le plus simple d'atteindre des performances de raisonnement solides et quelque chose appelé «mise à l'échelle du temps de test», où un modèle d'IA a plus de temps à réfléchir avant de répondre. Ce sont les mêmes innovations que le modèle O1 d'Openai a apportée à la table, que d'autres comme Deepseek ont essayé d'imiter avec leurs propres méthodes.

Le papier S1 suggère que vous pouvez distiller les modèles de raisonnement avec un ensemble de données relativement petit en utilisant une technique connue sous le nom de réglage fin supervisé (SFT). Cela implique de former le modèle d'IA pour copier des comportements spécifiques à partir d'un ensemble de données, et il est moins cher que l'apprentissage de renforcement à grande échelle que Deepseek a utilisé pour leur modèle R1, qui rivalise avec l'O1 d'OpenAI.

Google rend Gemini 2.0 Flash Thinking Experimental disponible gratuitement via sa plate-forme Google AI Studio, mais avec des limites quotidiennes. Mais il y a un hic - les termes de Google ne permettent pas à l'ingénierie inverse de ses modèles pour créer des services concurrents. Nous attendons de revoir Google à ce sujet.

Le modèle S1 lui-même a commencé la vie comme un modèle AI modeste et standard du laboratoire Qwen d'Alibaba, que n'importe qui peut télécharger gratuitement. Pour former S1, les chercheurs ont mis en place un ensemble de données de seulement 1 000 questions soigneusement choisies, ainsi que des réponses et le processus de "pensée" derrière chacun, gracieuseté de Google's Gemini 2.0. L'ensemble du processus de formation a pris moins de 30 minutes sur 16 GPU NVIDIA H100. Selon Niklas Muennighoff, un chercheur de Stanford impliqué dans le projet, vous pourriez réussir aujourd'hui pour environ 20 $ en coûts de calcul.

Les chercheurs ont également tiré une décision intelligente pour faire en sorte que le S1 vérifie son travail et prolonge son temps de "pensée" - ils lui ont simplement dit "d'attendre". L'ajout de ce mot pendant le processus de raisonnement de S1 l'a aidé à trouver des réponses légèrement plus précises, selon le document.

En 2025, des géants de la technologie comme Meta, Google et Microsoft devraient verser des centaines de milliards dans l'infrastructure d'IA, dont une grande partie ira à former la prochaine vague de modèles d'IA. Bien que la distillation se révèle être un moyen efficace de recréer des capacités d'IA à bon marché, cela ne mènera pas à la création de nouveaux modèles d'IA révolutionnaires et révolutionnaires de sitôt.

Article connexe

OpenAI升級其Operator Agent的AI模型 OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構，這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動，但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面，o3幾乎在所有指標上都超越前

OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準為什麼 AI 基準測試的差異很重要？提到 AI 時，數字往往能說明一切——有時，這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆：據報導，o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考，競爭對手還停留在個位數。但隨著近期的發展，受人尊敬的研究機構 Epoch

Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波，Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導，該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容，製作了其作品的「精確副本」。這是截

commentaires (5)

0/200

Soumettre

HarryRoberts

23 avril 2025 00:00:00 UTC

This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀

DonaldGonzález

23 avril 2025 00:00:00 UTC

s1モデルが50ドル未満で開発されたなんて信じられない！OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい！🚀

GregoryAdams

22 avril 2025 00:00:00 UTC

s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀

JackPerez

21 avril 2025 00:00:00 UTC

O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀

HenryWalker

23 avril 2025 00:00:00 UTC

Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀

Top nouvelles

OpenAI améliore l'assistant vocal AI pour de meilleurs chats Découvrez les mots croisés d'E / S propulsés par l'IA: une touche moderne sur le jeu de mots classique L'informatique de l'IA pour consommer la puissance de plusieurs New York d'ici 2026, explique le fondateur Notebooklm se développe à l'échelle mondiale, ajoute des diapositives et une vérification des faits améliorée Le PDG de Nvidia clarifie les idées fausses sur l'impact du marché de Deepseek La Corée du Sud interrompt les téléchargements d'applications Deepseek dans les magasins locaux Adobe dévoile 10 agents d'IA spécialisés: découvrez leurs applications commerciales La consommation d'énergie de Chatgpt est plus faible que prévu Le modèle O3 d'Openai est potentiellement plus cher à utiliser que le pensée initialement Notebooklm ajoute une fonction de découverte de source Web

Plus

En vedette