Los investigadores desarrollan rival de código abierto al modelo de $ 50 'razonamiento' de OpenAI por menos de $ 50

El viernes pasado, un trabajo de investigación innovador de expertos en IA en Stanford y la Universidad de Washington llegaron a la escena, revelando que lograron desarrollar un modelo de "razonamiento" de IA, denominado S1, por menos de $ 50 en créditos de computar en la nube. Esta revelación está sacudiendo el mundo de la IA, ya que S1 se mantiene suyo contra modelos de primer nivel como Openi's O1 y Deepseek's R1 cuando se trata de abordar matemáticas y desafíos de codificación.
El modelo S1, junto con todos los detalles jugosos de sus datos y código de entrenamiento, ahora está en juego en GitHub. El equipo inició las cosas con un modelo de base corriente y luego lo puso a través del escurridor con una técnica llamada destilación. Este proceso implica exprimir el jugo de "razonamiento" de otro modelo de IA entrenando en sus respuestas. En este caso, S1 obtuvo su inteligencia del modelo experimental Gemini 2.0 Flash Thinking de Google. Es una táctica similar a lo que los investigadores de Berkeley usaron para preparar su propio modelo de razonamiento de IA por alrededor de $ 450 el mes pasado.
Para algunos, la idea de que un pequeño equipo de investigadores aún puede hacer olas en el campo de IA sin un presupuesto masivo es emocionante. Pero el surgimiento de S1 también provoca algunas preguntas serias sobre el futuro del desarrollo del modelo de IA. Si un modelo que rivaliza con los construidos con millones puede replicarse en un presupuesto reducido, ¿qué es lo que impide que todos hagan lo mismo?
No es sorprendente que los grandes jugadores de la IA no están encantados. Operai, por ejemplo, tiene dedos señalados a Deepseek, acusándolos de usar sus datos API para combinar la destilación del modelo. Mientras tanto, el equipo S1 se centró en encontrar la forma más directa de lograr un rendimiento de razonamiento sólido y algo llamado "escalado de tiempo de prueba", donde un modelo de IA tiene más tiempo para pensar antes de responder. Estas son las mismas innovaciones que el modelo O1 de OpenAI trajo a la mesa, que otros como Deepseek han tratado de imitar con sus propios métodos.
El documento S1 sugiere que puede destilar modelos de razonamiento con un conjunto de datos relativamente pequeño utilizando una técnica conocida como ajuste fino supervisado (SFT). Esto implica capacitar al modelo AI para copiar comportamientos específicos de un conjunto de datos, y es más barato que el aprendizaje de refuerzo a gran escala que Deepseek utilizó para su modelo R1, que compite con Openi's O1.
Google hace que Gemini 2.0 Flash Thinking Experimental esté disponible de forma gratuita a través de su plataforma Google AI Studio, aunque con límites diarios. Pero hay una captura: los términos de Google no permiten que sus modelos creen servicios competitivos. Estamos esperando recibir noticias de Google en esto.
El modelo S1 en sí comenzó su vida como un modelo AI modesto y listo para usar del laboratorio Qwen de Alibaba, que cualquiera puede descargar de forma gratuita. Para entrenar S1, los investigadores reunieron un conjunto de datos de solo 1,000 preguntas cuidadosamente elegidas, junto con respuestas y el proceso de "pensamiento" detrás de cada uno, cortesía de Gemini 2.0 de Google. Todo el proceso de entrenamiento tomó menos de 30 minutos en 16 GPU H100 NVIDIA. Según Niklas Manennighoff, un investigador de Stanford involucrado en el proyecto, podría lograrlo hoy por alrededor de $ 20 en costos de cómputo.
Los investigadores también lograron un movimiento inteligente para hacer que S1 verifique su trabajo y extienda su tiempo "pensante", simplemente lo dijeron que "esperara". Agregar esta palabra durante el proceso de razonamiento de S1 ayudó a obtener respuestas un poco más precisas, según el documento.
Mirando hacia el futuro hasta 2025, los gigantes tecnológicos como Meta, Google y Microsoft están listos para verter cientos de miles de millones en infraestructura de IA, gran parte de los cuales se destinarán a entrenar la próxima ola de modelos de IA. Si bien la destilación demuestra ser una forma efectiva de recrear capacidades de IA a bajo precio, no conducirá a la creación de modelos de IA nuevos e innovadores en el corto plazo.
Artículo relacionado
OpenAI升級其Operator Agent的AI模型
OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準
為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權
Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
comentario (5)
0/200
HarryRoberts
23 de abril de 2025 00:00:00 GMT
This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀
0
DonaldGonzález
23 de abril de 2025 00:00:00 GMT
s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀
0
GregoryAdams
22 de abril de 2025 00:00:00 GMT
s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀
0
JackPerez
21 de abril de 2025 00:00:00 GMT
O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀
0
HenryWalker
23 de abril de 2025 00:00:00 GMT
Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀
0
El viernes pasado, un trabajo de investigación innovador de expertos en IA en Stanford y la Universidad de Washington llegaron a la escena, revelando que lograron desarrollar un modelo de "razonamiento" de IA, denominado S1, por menos de $ 50 en créditos de computar en la nube. Esta revelación está sacudiendo el mundo de la IA, ya que S1 se mantiene suyo contra modelos de primer nivel como Openi's O1 y Deepseek's R1 cuando se trata de abordar matemáticas y desafíos de codificación.
El modelo S1, junto con todos los detalles jugosos de sus datos y código de entrenamiento, ahora está en juego en GitHub. El equipo inició las cosas con un modelo de base corriente y luego lo puso a través del escurridor con una técnica llamada destilación. Este proceso implica exprimir el jugo de "razonamiento" de otro modelo de IA entrenando en sus respuestas. En este caso, S1 obtuvo su inteligencia del modelo experimental Gemini 2.0 Flash Thinking de Google. Es una táctica similar a lo que los investigadores de Berkeley usaron para preparar su propio modelo de razonamiento de IA por alrededor de $ 450 el mes pasado.
Para algunos, la idea de que un pequeño equipo de investigadores aún puede hacer olas en el campo de IA sin un presupuesto masivo es emocionante. Pero el surgimiento de S1 también provoca algunas preguntas serias sobre el futuro del desarrollo del modelo de IA. Si un modelo que rivaliza con los construidos con millones puede replicarse en un presupuesto reducido, ¿qué es lo que impide que todos hagan lo mismo?
No es sorprendente que los grandes jugadores de la IA no están encantados. Operai, por ejemplo, tiene dedos señalados a Deepseek, acusándolos de usar sus datos API para combinar la destilación del modelo. Mientras tanto, el equipo S1 se centró en encontrar la forma más directa de lograr un rendimiento de razonamiento sólido y algo llamado "escalado de tiempo de prueba", donde un modelo de IA tiene más tiempo para pensar antes de responder. Estas son las mismas innovaciones que el modelo O1 de OpenAI trajo a la mesa, que otros como Deepseek han tratado de imitar con sus propios métodos.
El documento S1 sugiere que puede destilar modelos de razonamiento con un conjunto de datos relativamente pequeño utilizando una técnica conocida como ajuste fino supervisado (SFT). Esto implica capacitar al modelo AI para copiar comportamientos específicos de un conjunto de datos, y es más barato que el aprendizaje de refuerzo a gran escala que Deepseek utilizó para su modelo R1, que compite con Openi's O1.
Google hace que Gemini 2.0 Flash Thinking Experimental esté disponible de forma gratuita a través de su plataforma Google AI Studio, aunque con límites diarios. Pero hay una captura: los términos de Google no permiten que sus modelos creen servicios competitivos. Estamos esperando recibir noticias de Google en esto.
El modelo S1 en sí comenzó su vida como un modelo AI modesto y listo para usar del laboratorio Qwen de Alibaba, que cualquiera puede descargar de forma gratuita. Para entrenar S1, los investigadores reunieron un conjunto de datos de solo 1,000 preguntas cuidadosamente elegidas, junto con respuestas y el proceso de "pensamiento" detrás de cada uno, cortesía de Gemini 2.0 de Google. Todo el proceso de entrenamiento tomó menos de 30 minutos en 16 GPU H100 NVIDIA. Según Niklas Manennighoff, un investigador de Stanford involucrado en el proyecto, podría lograrlo hoy por alrededor de $ 20 en costos de cómputo.
Los investigadores también lograron un movimiento inteligente para hacer que S1 verifique su trabajo y extienda su tiempo "pensante", simplemente lo dijeron que "esperara". Agregar esta palabra durante el proceso de razonamiento de S1 ayudó a obtener respuestas un poco más precisas, según el documento.
Mirando hacia el futuro hasta 2025, los gigantes tecnológicos como Meta, Google y Microsoft están listos para verter cientos de miles de millones en infraestructura de IA, gran parte de los cuales se destinarán a entrenar la próxima ola de modelos de IA. Si bien la destilación demuestra ser una forma efectiva de recrear capacidades de IA a bajo precio, no conducirá a la creación de modelos de IA nuevos e innovadores en el corto plazo.




This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀




s1モデルが50ドル未満で開発されたなんて信じられない!OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい!🚀




s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀




O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀




Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀












