вариант
Дом
Новости
Исследователи разрабатывают конкурент с открытым исходным кодом для модели «Рассуждение на 50 долларов» за менее чем 50 долларов США.

Исследователи разрабатывают конкурент с открытым исходным кодом для модели «Рассуждение на 50 долларов» за менее чем 50 долларов США.

21 апреля 2025 г.
145

Исследователи разрабатывают конкурент с открытым исходным кодом для модели «Рассуждение на 50 долларов» за менее чем 50 долларов США.

В прошлую пятницу был опубликован новаторский научный труд от экспертов по ИИ из Стэнфорда и Вашингтонского университета, в котором сообщается, что им удалось разработать модель ИИ "рассуждения", названную s1, за менее чем 50 долларов в кредитах на облачные вычисления. Это открытие потрясает мир ИИ, поскольку s1 успешно конкурирует с топовыми моделями, такими как o1 от OpenAI и R1 от DeepSeek, в решении математических и программистских задач.

Модель s1, вместе со всеми подробностями её тренировочных данных и кода, теперь доступна на GitHub. Команда начала с обычной базовой модели, а затем применила технику под названием дистилляция. Этот процесс включает извлечение "рассуждений" из другой модели ИИ путём обучения на её ответах. В данном случае s1 получила свои способности от экспериментальной модели Google Gemini 2.0 Flash Thinking. Это схожая тактика с той, что использовали исследователи из Беркли для создания собственной модели ИИ-рассуждений за около 450 долларов в прошлом месяце.

Для некоторых захватывающе, что небольшая команда исследователей всё ещё может производить фурор в области ИИ без огромного бюджета. Но появление s1 также вызывает серьёзные вопросы о будущем развития моделей ИИ. Если модель, конкурирующая с теми, что создавались за миллионы, может быть воспроизведена с минимальным бюджетом, что мешает всем делать то же самое?

Неудивительно, что крупные игроки в области ИИ не в восторге. Например, OpenAI обвинила DeepSeek в использовании данных их API для дистилляции моделей. Тем временем команда s1 сосредоточилась на поиске самого простого способа достижения хороших результатов в рассуждениях и так называемого "масштабирования во время тестирования", когда модели ИИ предоставляется больше времени на обдумывание перед ответом. Эти же инновации представила модель o1 от OpenAI, которые другие, такие как DeepSeek, пытались воспроизвести своими методами.

Статья о s1 предполагает, что можно дистиллировать модели рассуждений с относительно небольшим набором данных, используя технику, известную как supervised fine-tuning (SFT). Это включает обучение модели ИИ копировать определённое поведение из набора данных, и это дешевле, чем масштабное обучение с подкреплением, которое DeepSeek использовала для своей модели R1, конкурирующей с o1 от OpenAI.

Google предоставляет Gemini 2.0 Flash Thinking Experimental бесплатно через платформу Google AI Studio, но с дневными ограничениями. Однако есть загвоздка — условия Google запрещают реверс-инжиниринг их моделей для создания конкурирующих сервисов. Мы ждём ответа от Google по этому поводу.

Сама модель s1 началась как скромная, готовая модель ИИ от лаборатории Qwen компании Alibaba, которую любой может скачать бесплатно. Для обучения s1 исследователи собрали набор из всего 1000 тщательно отобранных вопросов вместе с ответами и процессом "мышления" для каждого, предоставленных Google Gemini 2.0. Весь процесс обучения занял менее 30 минут на 16 GPU Nvidia H100. По словам Никласа Мюннигхоффа, исследователя из Стэнфорда, участвовавшего в проекте, сегодня это можно сделать примерно за 20 долларов в вычислительных затратах.

Исследователи также применили хитрый ход, чтобы заставить s1 перепроверять свою работу и увеличивать время "мышления" — они просто сказали ей "ждать". Добавление этого слова в процесс рассуждений s1 помогло ей давать немного более точные ответы, согласно статье.

Взгляд в 2025 год: технологические гиганты, такие как Meta, Google и Microsoft, планируют вложить сотни миллиардов в инфраструктуру ИИ, большая часть которых пойдёт на обучение следующей волны моделей ИИ. Хотя дистилляция доказала свою эффективность для дешёвого воспроизведения возможностей ИИ, она не приведёт к созданию совершенно новых, революционных моделей ИИ в ближайшем будущем.

Связанная статья
Некоммерческая организация использует агентов искусственного интеллекта для повышения эффективности сбора средств на благотворительность Некоммерческая организация использует агентов искусственного интеллекта для повышения эффективности сбора средств на благотворительность В то время как крупные технологические корпорации продвигают "агентов" искусственного интеллекта как средства повышения производительности бизнеса, одна некоммерческая организация демонстрирует их пот
Ведущие лаборатории искусственного интеллекта предупреждают, что человечество теряет понимание систем ИИ Ведущие лаборатории искусственного интеллекта предупреждают, что человечество теряет понимание систем ИИ В беспрецедентной демонстрации единства исследователи из OpenAI, Google DeepMind, Anthropic и Meta отложили в сторону конкурентные разногласия, чтобы выступить с коллективным предупреждением об ответс
ChatGPT добавляет интеграцию с Google Drive и Dropbox для доступа к файлам ChatGPT добавляет интеграцию с Google Drive и Dropbox для доступа к файлам ChatGPT повышает продуктивность благодаря новым корпоративным функциямКомпания OpenAI представила две новые мощные функции, превращающие ChatGPT в комплексный инструмент повышения производительности
RalphSmith
RalphSmith 23 сентября 2025 г., 11:30:42 GMT+03:00

Это просто невероятно! 🚀 Создать аналог OpenAI за $50 — это настоящий прорыв. Интересно, какие возможности откроются для небольших стартапов и исследователей? Может, скоро мы увидим взлет новых AI-проектов без гигантских бюджетов.

StevenWilson
StevenWilson 8 августа 2025 г., 12:00:59 GMT+03:00

Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔

BenRoberts
BenRoberts 1 августа 2025 г., 5:48:18 GMT+03:00

Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀

DonaldGonzález
DonaldGonzález 23 апреля 2025 г., 2:45:55 GMT+03:00

s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀

HarryRoberts
HarryRoberts 23 апреля 2025 г., 1:38:34 GMT+03:00

This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀

HenryWalker
HenryWalker 23 апреля 2025 г., 1:34:07 GMT+03:00

Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀

Вернуться к вершине
OR