Los investigadores desarrollan rival de código abierto al modelo de $ 50 'razonamiento' de OpenAI por menos de $ 50

El viernes pasado, un artículo de investigación revolucionario de expertos en IA de Stanford y la Universidad de Washington llegó a la escena, revelando que lograron desarrollar un modelo de IA de "razonamiento", denominado s1, por menos de $50 en créditos de cómputo en la nube. Esta revelación está sacudiendo el mundo de la IA, ya que s1 se mantiene firme frente a modelos de primer nivel como el o1 de OpenAI y el R1 de DeepSeek cuando se trata de abordar desafíos de matemáticas y programación.
El modelo s1, junto con todos los detalles jugosos de sus datos de entrenamiento y código, está ahora disponible en GitHub. El equipo comenzó con un modelo base común y corriente y luego lo sometió a un proceso intenso con una técnica llamada destilación. Este proceso implica extraer el "jugo" del razonamiento de otro modelo de IA al entrenarlo con sus respuestas. En este caso, s1 obtuvo su inteligencia del modelo experimental Gemini 2.0 Flash Thinking de Google. Es una táctica similar a la que usaron los investigadores de Berkeley para crear su propio modelo de razonamiento de IA por alrededor de $450 el mes pasado.
Para algunos, la idea de que un pequeño equipo de investigadores aún pueda causar revuelo en el campo de la IA sin un presupuesto masivo es emocionante. Pero la aparición de s1 también plantea preguntas serias sobre el futuro del desarrollo de modelos de IA. Si un modelo que rivaliza con aquellos construidos con millones puede replicarse con un presupuesto mínimo, ¿qué impide que todos hagan lo mismo?
No es sorprendente que los grandes actores en IA no estén entusiasmados. OpenAI, por ejemplo, ha señalado a DeepSeek, acusándolos de usar sus datos de API para alimentar la destilación de modelos. Mientras tanto, el equipo de s1 se enfocó en encontrar la forma más directa de lograr un sólido desempeño en razonamiento y algo llamado "escalado en tiempo de prueba", donde un modelo de IA tiene más tiempo para pensar antes de responder. Estas son las mismas innovaciones que el modelo o1 de OpenAI trajo a la mesa, que otros como DeepSeek han intentado imitar con sus propios métodos.
El artículo de s1 sugiere que se pueden destilar modelos de razonamiento con un conjunto de datos relativamente pequeño utilizando una técnica conocida como ajuste fino supervisado (SFT). Esto implica entrenar al modelo de IA para copiar comportamientos específicos de un conjunto de datos, y es más barato que el aprendizaje por refuerzo a gran escala que DeepSeek usó para su modelo R1, que compite con el o1 de OpenAI.
Google pone a disposición Gemini 2.0 Flash Thinking Experimental de forma gratuita a través de su plataforma Google AI Studio, aunque con límites diarios. Pero hay un inconveniente: los términos de Google no permiten la ingeniería inversa de sus modelos para crear servicios competidores. Estamos esperando una respuesta de Google al respecto.
El modelo s1 en sí comenzó como un modesto modelo de IA listo para usar del laboratorio Qwen de Alibaba, que cualquiera puede descargar gratis. Para entrenar a s1, los investigadores armaron un conjunto de datos de solo 1,000 preguntas cuidadosamente seleccionadas, junto con respuestas y el proceso de "pensamiento" detrás de cada una, cortesía de Gemini 2.0 de Google. Todo el proceso de entrenamiento tomó menos de 30 minutos en 16 GPUs Nvidia H100. Según Niklas Muennighoff, un investigador de Stanford involucrado en el proyecto, hoy en día podrías lograr esto por unos $20 en costos de cómputo.
Los investigadores también hicieron un movimiento astuto para que s1 verificara su trabajo y extendiera su tiempo de "pensamiento": simplemente le dijeron que "espere". Agregar esta palabra durante el proceso de razonamiento de s1 ayudó a que generara respuestas ligeramente más precisas, según el artículo.
De cara a 2025, gigantes tecnológicos como Meta, Google y Microsoft están listos para invertir cientos de miles de millones en infraestructura de IA, gran parte de los cuales se destinarán a entrenar la próxima ola de modelos de IA. Aunque la destilación demuestra ser una forma efectiva de recrear capacidades de IA de manera económica, no conducirá a la creación de modelos de IA nuevos y revolucionarios en el corto plazo.
Artículo relacionado
Una organización sin ánimo de lucro aprovecha los agentes de IA para impulsar la recaudación de fondos benéficos
Mientras las grandes corporaciones tecnológicas promueven los "agentes" de IA como potenciadores de la productividad para las empresas, una organización sin ánimo de lucro está demostrando su potencia
Los principales laboratorios de IA advierten de que la humanidad está perdiendo el control sobre la comprensión de los sistemas de IA
En una muestra de unidad sin precedentes, investigadores de OpenAI, Google DeepMind, Anthropic y Meta han dejado de lado sus diferencias competitivas para lanzar una advertencia colectiva sobre el des
ChatGPT integra Google Drive y Dropbox para acceder a los archivos
ChatGPT mejora la productividad con nuevas funciones empresarialesOpenAI ha presentado dos nuevas y potentes funciones que transforman ChatGPT en una completa herramienta de productividad empresaria
comentario (8)
0/200
RalphSmith
23 de septiembre de 2025 10:30:42 GMT+02:00
Это просто невероятно! 🚀 Создать аналог OpenAI за $50 — это настоящий прорыв. Интересно, какие возможности откроются для небольших стартапов и исследователей? Может, скоро мы увидим взлет новых AI-проектов без гигантских бюджетов.
0
StevenWilson
8 de agosto de 2025 11:00:59 GMT+02:00
Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔
0
BenRoberts
1 de agosto de 2025 04:48:18 GMT+02:00
Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀
0
DonaldGonzález
23 de abril de 2025 01:45:55 GMT+02:00
s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀
0
HarryRoberts
23 de abril de 2025 00:38:34 GMT+02:00
This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀
0
HenryWalker
23 de abril de 2025 00:34:07 GMT+02:00
Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀
0
El viernes pasado, un artículo de investigación revolucionario de expertos en IA de Stanford y la Universidad de Washington llegó a la escena, revelando que lograron desarrollar un modelo de IA de "razonamiento", denominado s1, por menos de $50 en créditos de cómputo en la nube. Esta revelación está sacudiendo el mundo de la IA, ya que s1 se mantiene firme frente a modelos de primer nivel como el o1 de OpenAI y el R1 de DeepSeek cuando se trata de abordar desafíos de matemáticas y programación.
El modelo s1, junto con todos los detalles jugosos de sus datos de entrenamiento y código, está ahora disponible en GitHub. El equipo comenzó con un modelo base común y corriente y luego lo sometió a un proceso intenso con una técnica llamada destilación. Este proceso implica extraer el "jugo" del razonamiento de otro modelo de IA al entrenarlo con sus respuestas. En este caso, s1 obtuvo su inteligencia del modelo experimental Gemini 2.0 Flash Thinking de Google. Es una táctica similar a la que usaron los investigadores de Berkeley para crear su propio modelo de razonamiento de IA por alrededor de $450 el mes pasado.
Para algunos, la idea de que un pequeño equipo de investigadores aún pueda causar revuelo en el campo de la IA sin un presupuesto masivo es emocionante. Pero la aparición de s1 también plantea preguntas serias sobre el futuro del desarrollo de modelos de IA. Si un modelo que rivaliza con aquellos construidos con millones puede replicarse con un presupuesto mínimo, ¿qué impide que todos hagan lo mismo?
No es sorprendente que los grandes actores en IA no estén entusiasmados. OpenAI, por ejemplo, ha señalado a DeepSeek, acusándolos de usar sus datos de API para alimentar la destilación de modelos. Mientras tanto, el equipo de s1 se enfocó en encontrar la forma más directa de lograr un sólido desempeño en razonamiento y algo llamado "escalado en tiempo de prueba", donde un modelo de IA tiene más tiempo para pensar antes de responder. Estas son las mismas innovaciones que el modelo o1 de OpenAI trajo a la mesa, que otros como DeepSeek han intentado imitar con sus propios métodos.
El artículo de s1 sugiere que se pueden destilar modelos de razonamiento con un conjunto de datos relativamente pequeño utilizando una técnica conocida como ajuste fino supervisado (SFT). Esto implica entrenar al modelo de IA para copiar comportamientos específicos de un conjunto de datos, y es más barato que el aprendizaje por refuerzo a gran escala que DeepSeek usó para su modelo R1, que compite con el o1 de OpenAI.
Google pone a disposición Gemini 2.0 Flash Thinking Experimental de forma gratuita a través de su plataforma Google AI Studio, aunque con límites diarios. Pero hay un inconveniente: los términos de Google no permiten la ingeniería inversa de sus modelos para crear servicios competidores. Estamos esperando una respuesta de Google al respecto.
El modelo s1 en sí comenzó como un modesto modelo de IA listo para usar del laboratorio Qwen de Alibaba, que cualquiera puede descargar gratis. Para entrenar a s1, los investigadores armaron un conjunto de datos de solo 1,000 preguntas cuidadosamente seleccionadas, junto con respuestas y el proceso de "pensamiento" detrás de cada una, cortesía de Gemini 2.0 de Google. Todo el proceso de entrenamiento tomó menos de 30 minutos en 16 GPUs Nvidia H100. Según Niklas Muennighoff, un investigador de Stanford involucrado en el proyecto, hoy en día podrías lograr esto por unos $20 en costos de cómputo.
Los investigadores también hicieron un movimiento astuto para que s1 verificara su trabajo y extendiera su tiempo de "pensamiento": simplemente le dijeron que "espere". Agregar esta palabra durante el proceso de razonamiento de s1 ayudó a que generara respuestas ligeramente más precisas, según el artículo.
De cara a 2025, gigantes tecnológicos como Meta, Google y Microsoft están listos para invertir cientos de miles de millones en infraestructura de IA, gran parte de los cuales se destinarán a entrenar la próxima ola de modelos de IA. Aunque la destilación demuestra ser una forma efectiva de recrear capacidades de IA de manera económica, no conducirá a la creación de modelos de IA nuevos y revolucionarios en el corto plazo.




Это просто невероятно! 🚀 Создать аналог OpenAI за $50 — это настоящий прорыв. Интересно, какие возможности откроются для небольших стартапов и исследователей? Может, скоро мы увидим взлет новых AI-проектов без гигантских бюджетов.




Wow, $50 to rival OpenAI’s model? That’s wild! Makes me wonder how many garage startups are gonna jump on this to build their own AI. Super cool, but I’m curious if it’s as reliable as they claim. 🤔




Wow, $50 to rival a $50 OpenAI model? That's some serious bang for the buck! Loving how open-source is shaking up the AI game. 🚀




s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀




This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀




Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀












