Исследователи разрабатывают конкурент с открытым исходным кодом для модели «Рассуждение на 50 долларов» за менее чем 50 долларов США.

В прошлую пятницу, новаторский исследовательский документ от экспертов по искусственному искусству в Стэнфорде и Университета Вашингтона, выступившего на сцене, показав, что им удалось разработать модель «Рассуждения искусственного интеллекта», получившую название S1, за более чем 50 долларов в облачных вычислениях. Это откровение встряхивает мир ИИ, так как S1 выдерживает свои собственные модели высшего уровня, такие как Operai's O1 и Deepseek's R1, когда речь заходит о решении задач по математике и кодированию.
Модель S1, наряду со всеми сочными деталями его обучающих данных и кода, теперь готовится к захвату GitHub. Команда начала все с заурядной базовой модели, а затем поставила ее через технику, называемую дистилляцией. Этот процесс включает в себя вытягивание «рассуждения» сока из другой модели искусственного интеллекта путем обучения ее ответам. В этом случае S1 получил свои умные из экспериментальной модели Google Gemini 2.0 Flash Flash. Это аналогичная тактика с тем, что исследователи Беркли использовали, чтобы подготовить свою собственную модель рассуждения искусственного интеллекта примерно за 450 долларов только в прошлом месяце.
Для некоторых идея о том, что небольшая команда исследователей все еще может волноваться в области искусственного интеллекта без масштабного бюджета, является захватывающей. Но появление S1 также вызывает некоторые серьезные вопросы о будущем разработки модели искусственного искусства. Если модель, которая соперничает с теми, кто построен с миллионами, может быть воспроизведена по ограниченному бюджету, что может помешать всем делать то же самое?
Неудивительно, что крупные игроки в ИИ не взволнованы. Например, OpenAI застегнул пальцы на DeepSeek, обвинив их в использовании своих данных API для топлива модели дистилляции. Между тем, команда S1 была сосредоточена на поиске наиболее простых способов достижения надежных рассуждений и чего-то, что называется «масштабирование времени испытания», где модель искусственного интеллекта получает больше времени, чтобы подумать, прежде чем отвечать. Это те же инновации, что и модель Operai O1, которую принесли на стол, которые, как другие, такие как DeepSeek, пытались имитировать своими собственными методами.
Бумага S1 предполагает, что вы можете переоборудовать модели рассуждений с относительно небольшим набором данных, используя метод, известный как контролируемая точная настраиваемая (SFT). Это включает в себя обучение модели ИИ для копирования конкретного поведения из набора данных, и она дешевле, чем широкомасштабное обучение подкреплению, которое DeepSeek использовала для их модели R1, которая конкурирует с O1 OpenAI.
Google предоставляет Gemini 2.0 Flash Shlash Experimental Experimental бесплатно через свою платформу Google AI Studio, хотя и с ежедневными ограничениями. Но есть улов-термины Google не позволяют обратно инженерии своих моделей для создания конкурирующих услуг. Мы ждем, чтобы услышать от Google по этому поводу.
Сама модель S1 начала жизнь как скромную, готовую модель искусственного интеллекта из QWEN Lab's Alibaba, которую каждый может скачать бесплатно. Чтобы обучить S1, исследователи собрали набор данных всего 1000 тщательно выбранных вопросов, а также ответы и процесс «мышления», стоящего за каждым, любезно предоставленным Google Gemini 2.0. Весь процесс обучения занял менее 30 минут на 16 графических процессоров NVIDIA H100. По словам Никласа Мененгоффа, исследователя из Стэнфорда, участвующего в проекте, вы можете справиться с этим сегодня за 20 долларов.
Исследователи также сделали умный шаг, чтобы сделать S1 дважды проверить свою работу и продлить свое «мышление»-они просто сказали ему «подождать». Согласно документу, добавление этого слова в процессе рассуждения S1 помогло ему придумать немного более точные ответы.
Заглядывая в будущее до 2025 года, технологические гиганты, такие как Meta, Google и Microsoft, должны вкладывать сотни миллиардов в инфраструктуру ИИ, большая часть которых пойдет на подготовку следующей волны моделей ИИ. В то время как дистилляция оказывается эффективным способом воссоздания возможностей ИИ по дешевке, это не приведет к созданию совершенно новых, новаторских моделей ИИ в ближайшее время.
Связанная статья
OpenAI升級其Operator Agent的AI模型
OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準
為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權
Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
Комментарии (5)
HarryRoberts
23 апреля 2025 г., 0:00:00 GMT
This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀
0
DonaldGonzález
23 апреля 2025 г., 0:00:00 GMT
s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀
0
GregoryAdams
22 апреля 2025 г., 0:00:00 GMT
s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀
0
JackPerez
21 апреля 2025 г., 0:00:00 GMT
O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀
0
HenryWalker
23 апреля 2025 г., 0:00:00 GMT
Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀
0
В прошлую пятницу, новаторский исследовательский документ от экспертов по искусственному искусству в Стэнфорде и Университета Вашингтона, выступившего на сцене, показав, что им удалось разработать модель «Рассуждения искусственного интеллекта», получившую название S1, за более чем 50 долларов в облачных вычислениях. Это откровение встряхивает мир ИИ, так как S1 выдерживает свои собственные модели высшего уровня, такие как Operai's O1 и Deepseek's R1, когда речь заходит о решении задач по математике и кодированию.
Модель S1, наряду со всеми сочными деталями его обучающих данных и кода, теперь готовится к захвату GitHub. Команда начала все с заурядной базовой модели, а затем поставила ее через технику, называемую дистилляцией. Этот процесс включает в себя вытягивание «рассуждения» сока из другой модели искусственного интеллекта путем обучения ее ответам. В этом случае S1 получил свои умные из экспериментальной модели Google Gemini 2.0 Flash Flash. Это аналогичная тактика с тем, что исследователи Беркли использовали, чтобы подготовить свою собственную модель рассуждения искусственного интеллекта примерно за 450 долларов только в прошлом месяце.
Для некоторых идея о том, что небольшая команда исследователей все еще может волноваться в области искусственного интеллекта без масштабного бюджета, является захватывающей. Но появление S1 также вызывает некоторые серьезные вопросы о будущем разработки модели искусственного искусства. Если модель, которая соперничает с теми, кто построен с миллионами, может быть воспроизведена по ограниченному бюджету, что может помешать всем делать то же самое?
Неудивительно, что крупные игроки в ИИ не взволнованы. Например, OpenAI застегнул пальцы на DeepSeek, обвинив их в использовании своих данных API для топлива модели дистилляции. Между тем, команда S1 была сосредоточена на поиске наиболее простых способов достижения надежных рассуждений и чего-то, что называется «масштабирование времени испытания», где модель искусственного интеллекта получает больше времени, чтобы подумать, прежде чем отвечать. Это те же инновации, что и модель Operai O1, которую принесли на стол, которые, как другие, такие как DeepSeek, пытались имитировать своими собственными методами.
Бумага S1 предполагает, что вы можете переоборудовать модели рассуждений с относительно небольшим набором данных, используя метод, известный как контролируемая точная настраиваемая (SFT). Это включает в себя обучение модели ИИ для копирования конкретного поведения из набора данных, и она дешевле, чем широкомасштабное обучение подкреплению, которое DeepSeek использовала для их модели R1, которая конкурирует с O1 OpenAI.
Google предоставляет Gemini 2.0 Flash Shlash Experimental Experimental бесплатно через свою платформу Google AI Studio, хотя и с ежедневными ограничениями. Но есть улов-термины Google не позволяют обратно инженерии своих моделей для создания конкурирующих услуг. Мы ждем, чтобы услышать от Google по этому поводу.
Сама модель S1 начала жизнь как скромную, готовую модель искусственного интеллекта из QWEN Lab's Alibaba, которую каждый может скачать бесплатно. Чтобы обучить S1, исследователи собрали набор данных всего 1000 тщательно выбранных вопросов, а также ответы и процесс «мышления», стоящего за каждым, любезно предоставленным Google Gemini 2.0. Весь процесс обучения занял менее 30 минут на 16 графических процессоров NVIDIA H100. По словам Никласа Мененгоффа, исследователя из Стэнфорда, участвующего в проекте, вы можете справиться с этим сегодня за 20 долларов.
Исследователи также сделали умный шаг, чтобы сделать S1 дважды проверить свою работу и продлить свое «мышление»-они просто сказали ему «подождать». Согласно документу, добавление этого слова в процессе рассуждения S1 помогло ему придумать немного более точные ответы.
Заглядывая в будущее до 2025 года, технологические гиганты, такие как Meta, Google и Microsoft, должны вкладывать сотни миллиардов в инфраструктуру ИИ, большая часть которых пойдет на подготовку следующей волны моделей ИИ. В то время как дистилляция оказывается эффективным способом воссоздания возможностей ИИ по дешевке, это не приведет к созданию совершенно новых, новаторских моделей ИИ в ближайшее время.




This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀




s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀




s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀




O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀




Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀












