연구자들은 OpenAi의 $ 50 '추론'모델에 대한 오픈 소스 라이벌을 50 달러 미만으로 개발합니다.

지난 금요일, 스탠포드와 워싱턴 대학교의 AI 전문가들이 발표한 획기적인 연구 논문이 공개되며, 그들이 클라우드 컴퓨팅 크레딧으로 50달러 미만의 비용으로 AI "추론" 모델인 s1을 개발했다는 사실이 밝혀졌다. 이 소식은 AI 세계를 뒤흔들고 있으며, s1은 수학 및 코딩 과제에서 OpenAI의 o1이나 DeepSeek의 R1 같은 최상위 모델들과 경쟁할 수 있는 성능을 보여준다.
s1 모델과 그 훈련 데이터 및 코드의 모든 세부 사항은 이제 GitHub에서 누구나 이용할 수 있다. 연구팀은 평범한 기본 모델에서 시작해 증류라는 기술을 통해 모델을 강화했다. 이 과정은 다른 AI 모델의 응답을 훈련 데이터로 사용하여 "추론" 능력을 추출하는 것을 포함한다. 이 경우, s1은 Google의 Gemini 2.0 Flash Thinking Experimental 모델에서 지능을 얻었다. 이는 버클리 연구자들이 지난 달 약 450달러로 자체 AI 추론 모델을 개발할 때 사용한 것과 유사한 전략이다.
일부 사람들에게는 소규모 연구팀이 거대한 예산 없이도 AI 분야에서 파장을 일으킬 수 있다는 사실이 흥미롭다. 하지만 s1의 등장은 AI 모델 개발의 미래에 대한 심각한 질문을 불러일으킨다. 수백만 달러로 구축된 모델과 경쟁할 수 있는 모델이 저렴한 예산으로 복제될 수 있다면, 모두가 똑같이 하지 못할 이유가 있을까?
당연히 AI 업계의 거대 기업들은 이에 대해 기뻐하지 않는다. 예를 들어, OpenAI는 DeepSeek이 그들의 API 데이터를 사용하여 모델 증류를 했다고 비난했다. 한편, s1 팀은 견고한 추론 성능과 "테스트 시간 스케일링"이라는 것을 달성하는 가장 간단한 방법을 찾는 데 집중했다. 이는 AI 모델이 답변 전에 더 많은 시간을 "생각"하도록 하는 것으로, OpenAI의 o1 모델이 도입한 혁신과 동일하며, DeepSeek 같은 다른 기업들이 자체 방식으로 모방하려 한 바 있다.
s1 논문은 비교적 작은 데이터셋을 사용하여 지도 미세 조정(SFT)이라는 기술로 추론 모델을 증류할 수 있다고 제안한다. 이는 AI 모델이 데이터셋에서 특정 행동을 모방하도록 훈련시키는 것으로, DeepSeek이 OpenAI의 o1과 경쟁하는 R1 모델에 사용한 대규모 강화 학습보다 비용이 적게 든다.
Google은 Gemini 2.0 Flash Thinking Experimental을 Google AI Studio 플랫폼을 통해 무료로 제공하지만, 일일 사용 제한이 있다. 하지만 한 가지 제약이 있다—Google의 약관은 경쟁 서비스를 만들기 위해 모델을 역설계하는 것을 허용하지 않는다. 이에 대해 Google의 답변을 기다리고 있다.
s1 모델 자체는 알리바바의 Qwen 연구소에서 제공하는 평범한 오프-더-셸프 AI 모델로 시작되었으며, 누구나 무료로 다운로드할 수 있다. s1을 훈련시키기 위해 연구팀은 Google의 Gemini 2.0에서 제공한 1,000개의 신중히 선별된 질문과 답변, 그리고 각 답변 뒤의 "사고" 과정을 데이터셋으로 구성했다. 전체 훈련 과정은 16개의 Nvidia H100 GPU에서 30분도 채 걸리지 않았다. 프로젝트에 참여한 스탠포드 연구원 Niklas Muennighoff에 따르면, 오늘날 약 20달러의 컴퓨팅 비용으로 이를 수행할 수 있다.
연구팀은 또한 s1이 자신의 작업을 다시 확인하고 "사고" 시간을 연장하도록 하는 영리한 방법을 사용했다—그저 "기다려"라고 지시한 것뿐이다. 논문에 따르면, s1의 추론 과정에서 이 단어를 추가하면 약간 더 정확한 답변을 도출하는 데 도움이 되었다.
2025년을 내다보면, Meta, Google, Microsoft 같은 기술 대기업들은 AI 인프라에 수천억 달러를 투자할 준비가 되어 있으며, 그 대부분은 차세대 AI 모델 훈련에 사용될 것이다. 증류가 저렴한 비용으로 AI 능력을 재현하는 효과적인 방법임이 입증되었지만, 당분간 완전히 새로운 획기적인 AI 모델을 만드는 데는 이르지 않을 것이다.
관련 기사
OpenAI, ChatGPT Pro를 o3로 업그레이드하고 월 구독료 $200로 가치 증대
이번 주에는 마이크로소프트, 구글, 앤트로픽을 비롯한 거대 기술 기업들의 중요한 AI 개발이 있었습니다. OpenAI는 코드명 "io"라는 야심찬 하드웨어 이니셔티브를 위해 65억 달러에 인수한 조니 아이브의 디자인 회사를 넘어서는 획기적인 업데이트를 발표하며 활발한 발표를 마무리했습니다.이 회사는 이전의 GPT-4o 프레임워크에서 고급 추론 모델인 o3로
AI 에이전트를 활용하여 자선 기금 모금 활동을 강화하는 비영리 단체
주요 기술 기업들이 AI '에이전트'를 기업의 생산성을 높여주는 도구로 홍보하는 가운데, 한 비영리 단체는 사회적 공익을 위한 AI의 잠재력을 입증하고 있습니다. 오픈 필란트로피의 지원을 받는 자선 연구 단체인 세이지 퓨처는 최근 AI 모델이 자선 기금 모금에 어떻게 협력할 수 있는지 보여주는 혁신적인 실험을 진행했습니다.이 비영리 단체는 자선 단체를
최고의 AI 연구소, 인류가 AI 시스템에 대한 이해력을 잃어가고 있다고 경고하다
전례 없는 단결력을 보여준 OpenAI, Google DeepMind, Anthropic, Meta의 연구원들은 경쟁적 차이를 제쳐두고 책임감 있는 AI 개발에 대한 공동의 경고를 발표했습니다. 일반적으로 라이벌 관계에 있는 이들 조직의 40여 명의 선도적인 과학자들은 AI 의사결정 과정의 투명성을 보장하기 위해 빠르게 닫혀가는 창을 강조하는 획기적인 연구
의견 (8)
0/200
RalphSmith
2025년 9월 23일 오후 5시 30분 42초 GMT+09:00
Это просто невероятно! 🚀 Создать аналог OpenAI за $50 — это настоящий прорыв. Интересно, какие возможности откроются для небольших стартапов и исследователей? Может, скоро мы увидим взлет новых AI-проектов без гигантских бюджетов.
0
StevenWilson
2025년 8월 8일 오후 6시 0분 59초 GMT+09:00
Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔
0
BenRoberts
2025년 8월 1일 오전 11시 48분 18초 GMT+09:00
Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀
0
DonaldGonzález
2025년 4월 23일 오전 8시 45분 55초 GMT+09:00
s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀
0
HarryRoberts
2025년 4월 23일 오전 7시 38분 34초 GMT+09:00
This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀
0
HenryWalker
2025년 4월 23일 오전 7시 34분 7초 GMT+09:00
Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀
0
지난 금요일, 스탠포드와 워싱턴 대학교의 AI 전문가들이 발표한 획기적인 연구 논문이 공개되며, 그들이 클라우드 컴퓨팅 크레딧으로 50달러 미만의 비용으로 AI "추론" 모델인 s1을 개발했다는 사실이 밝혀졌다. 이 소식은 AI 세계를 뒤흔들고 있으며, s1은 수학 및 코딩 과제에서 OpenAI의 o1이나 DeepSeek의 R1 같은 최상위 모델들과 경쟁할 수 있는 성능을 보여준다.
s1 모델과 그 훈련 데이터 및 코드의 모든 세부 사항은 이제 GitHub에서 누구나 이용할 수 있다. 연구팀은 평범한 기본 모델에서 시작해 증류라는 기술을 통해 모델을 강화했다. 이 과정은 다른 AI 모델의 응답을 훈련 데이터로 사용하여 "추론" 능력을 추출하는 것을 포함한다. 이 경우, s1은 Google의 Gemini 2.0 Flash Thinking Experimental 모델에서 지능을 얻었다. 이는 버클리 연구자들이 지난 달 약 450달러로 자체 AI 추론 모델을 개발할 때 사용한 것과 유사한 전략이다.
일부 사람들에게는 소규모 연구팀이 거대한 예산 없이도 AI 분야에서 파장을 일으킬 수 있다는 사실이 흥미롭다. 하지만 s1의 등장은 AI 모델 개발의 미래에 대한 심각한 질문을 불러일으킨다. 수백만 달러로 구축된 모델과 경쟁할 수 있는 모델이 저렴한 예산으로 복제될 수 있다면, 모두가 똑같이 하지 못할 이유가 있을까?
당연히 AI 업계의 거대 기업들은 이에 대해 기뻐하지 않는다. 예를 들어, OpenAI는 DeepSeek이 그들의 API 데이터를 사용하여 모델 증류를 했다고 비난했다. 한편, s1 팀은 견고한 추론 성능과 "테스트 시간 스케일링"이라는 것을 달성하는 가장 간단한 방법을 찾는 데 집중했다. 이는 AI 모델이 답변 전에 더 많은 시간을 "생각"하도록 하는 것으로, OpenAI의 o1 모델이 도입한 혁신과 동일하며, DeepSeek 같은 다른 기업들이 자체 방식으로 모방하려 한 바 있다.
s1 논문은 비교적 작은 데이터셋을 사용하여 지도 미세 조정(SFT)이라는 기술로 추론 모델을 증류할 수 있다고 제안한다. 이는 AI 모델이 데이터셋에서 특정 행동을 모방하도록 훈련시키는 것으로, DeepSeek이 OpenAI의 o1과 경쟁하는 R1 모델에 사용한 대규모 강화 학습보다 비용이 적게 든다.
Google은 Gemini 2.0 Flash Thinking Experimental을 Google AI Studio 플랫폼을 통해 무료로 제공하지만, 일일 사용 제한이 있다. 하지만 한 가지 제약이 있다—Google의 약관은 경쟁 서비스를 만들기 위해 모델을 역설계하는 것을 허용하지 않는다. 이에 대해 Google의 답변을 기다리고 있다.
s1 모델 자체는 알리바바의 Qwen 연구소에서 제공하는 평범한 오프-더-셸프 AI 모델로 시작되었으며, 누구나 무료로 다운로드할 수 있다. s1을 훈련시키기 위해 연구팀은 Google의 Gemini 2.0에서 제공한 1,000개의 신중히 선별된 질문과 답변, 그리고 각 답변 뒤의 "사고" 과정을 데이터셋으로 구성했다. 전체 훈련 과정은 16개의 Nvidia H100 GPU에서 30분도 채 걸리지 않았다. 프로젝트에 참여한 스탠포드 연구원 Niklas Muennighoff에 따르면, 오늘날 약 20달러의 컴퓨팅 비용으로 이를 수행할 수 있다.
연구팀은 또한 s1이 자신의 작업을 다시 확인하고 "사고" 시간을 연장하도록 하는 영리한 방법을 사용했다—그저 "기다려"라고 지시한 것뿐이다. 논문에 따르면, s1의 추론 과정에서 이 단어를 추가하면 약간 더 정확한 답변을 도출하는 데 도움이 되었다.
2025년을 내다보면, Meta, Google, Microsoft 같은 기술 대기업들은 AI 인프라에 수천억 달러를 투자할 준비가 되어 있으며, 그 대부분은 차세대 AI 모델 훈련에 사용될 것이다. 증류가 저렴한 비용으로 AI 능력을 재현하는 효과적인 방법임이 입증되었지만, 당분간 완전히 새로운 획기적인 AI 모델을 만드는 데는 이르지 않을 것이다.




Это просто невероятно! 🚀 Создать аналог OpenAI за $50 — это настоящий прорыв. Интересно, какие возможности откроются для небольших стартапов и исследователей? Может, скоро мы увидим взлет новых AI-проектов без гигантских бюджетов.




Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔




Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀




s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀




This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀




Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀












