Os pesquisadores desenvolvem rival de código aberto ao modelo de 'raciocínio' de US $ 50 do OpenAI por menos de US $ 50

Lar

Notícias

21 de Abril de 2025

JosephWalker

# openai # DeepSeek

Os pesquisadores desenvolvem rival de código aberto ao modelo de 'raciocínio' de US $ 50 do OpenAI por menos de US $ 50

Na sexta -feira passada, um artigo de pesquisa inovador da IA especialistas em Stanford e da Universidade de Washington entrou em cena, revelando que eles conseguiram desenvolver um modelo de "raciocínio" da IA, apelidado de S1, por menos de US $ 50 em créditos de computação em nuvem. Essa revelação está agitando o mundo da IA, pois o S1 se mantém contra modelos de primeira linha como o OpenAi da Open e o Deepseek's R1 quando se trata de enfrentar os desafios de matemática e codificação.

O modelo S1, juntamente com todos os detalhes suculentos de seus dados e código de treinamento, agora está em disputa no Github. A equipe começou as coisas com um modelo básico comum e depois o colocou através do Wringer com uma técnica chamada destilação. Esse processo envolve espremer o suco de "raciocínio" de outro modelo de IA treinando suas respostas. Nesse caso, a S1 obteve sua inteligência do modelo experimental de pensamento flash flash do Google. É uma tática semelhante ao que os pesquisadores de Berkeley usaram para criar seu próprio modelo de raciocínio de IA por cerca de US $ 450 no mês passado.

Para alguns, a ideia de que uma pequena equipe de pesquisadores ainda pode fazer ondas no campo da IA sem um orçamento maciço é emocionante. Mas o surgimento de S1 também gera algumas perguntas sérias sobre o futuro do desenvolvimento do modelo de IA. Se um modelo que rivaliza com aqueles construídos com milhões pode ser replicado com um orçamento apertado, o que é impedir que todos façam o mesmo?

Não é de surpreender que os grandes jogadores da IA não estejam emocionados. O OpenAI, por exemplo, apontou os dedos para a Deepseek, acusando -os de usar seus dados da API para alimentar a destilação do modelo. Enquanto isso, a equipe S1 estava focada em encontrar a maneira mais direta de obter um sólido desempenho de raciocínio e algo chamado "escala no tempo de teste", onde um modelo de IA recebe mais tempo para pensar antes de responder. Essas são as mesmas inovações que o modelo O1 do OpenAI trouxe para a mesa, que outras pessoas como Deepseek tentaram imitar com seus próprios métodos.

O artigo S1 sugere que você pode destilar modelos de raciocínio com um conjunto de dados relativamente pequeno usando uma técnica conhecida como ajuste fino supervisionado (SFT). Isso envolve o treinamento do modelo de IA para copiar comportamentos específicos de um conjunto de dados e é mais barato que o aprendizado de reforço em larga escala que o DeepSeek usou para o modelo R1, que compete com o OpenAI da O1.

O Google torna o Gemini 2.0 Flash Thinking Experimental disponível gratuitamente através de sua plataforma de estúdio do Google AI, embora com limites diários. Mas há um problema-os termos do Google não permitem a engenharia reversa de seus modelos para criar serviços concorrentes. Estamos esperando para receber uma resposta do Google nisso.

O modelo S1 em si começou a vida como um modelo de IA modesto e pronta para o Laboratório Qwen do Alibaba, que qualquer pessoa pode baixar gratuitamente. Para treinar S1, os pesquisadores montam um conjunto de dados de apenas 1.000 perguntas cuidadosamente escolhidas, juntamente com as respostas e o processo de "pensamento" por trás de cada um, cortesia do Gemini 2.0 do Google. Todo o processo de treinamento levou menos de 30 minutos em 16 GPUs NVIDIA H100. De acordo com Niklas Muennighff, pesquisador de Stanford envolvido no projeto, você pode fazer isso hoje por cerca de US $ 20 em custos de computação.

Os pesquisadores também fizeram uma jogada inteligente para fazer com que a S1 verifique seu trabalho e estender seu tempo de "pensamento"-eles simplesmente disseram para "esperar". Adicionar essa palavra durante o processo de raciocínio da S1 ajudou a apresentar respostas um pouco mais precisas, de acordo com o artigo.

Olhando para o 2025, gigantes da tecnologia como Meta, Google e Microsoft estão prontos para despejar centenas de bilhões em infraestrutura de IA, grande parte das quais irá para treinar a próxima onda dos modelos de IA. Embora a destilação prove ser uma maneira eficaz de recriar os recursos de IA em barato, isso não levará à criação de modelos de IA inovadores e novos em breve.

Artigo relacionado

OpenAI升級其Operator Agent的AI模型 OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構，這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動，但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面，o3幾乎在所有指標上都超越前

OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準為什麼 AI 基準測試的差異很重要？提到 AI 時，數字往往能說明一切——有時，這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆：據報導，o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考，競爭對手還停留在個位數。但隨著近期的發展，受人尊敬的研究機構 Epoch

Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波，Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導，該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容，製作了其作品的「精確副本」。這是截

Comentários (5)

0/200

Enviar

HarryRoberts

23 de Abril de 2025 à0 00:00:00 GMT

This s1 model is insane! For under $50, you get a reasoning model that rivals OpenAI's? That's a game changer for sure. I'm excited to see how this shakes up the AI world. Can't wait to try it out myself! 🚀

DonaldGonzález

23 de Abril de 2025 à0 00:00:00 GMT

s1モデルが50ドル未満で開発されたなんて信じられない！OpenAIのモデルに匹敵するなんて、これはAI業界に革命をもたらすかもしれないね。早く試してみたい！🚀

GregoryAdams

22 de Abril de 2025 à0 00:00:00 GMT

s1 모델이 50달러도 안 되는 비용으로 개발되었다니 놀랍네요! OpenAI의 모델과 견줄 만하다니, AI 업계에 큰 변화가 있을 것 같아요. 빨리 사용해 보고 싶어요! 🚀

JackPerez

21 de Abril de 2025 à0 00:00:00 GMT

O modelo s1 por menos de $50 é incrível! Rivalizar com o modelo da OpenAI por esse preço é uma revolução. Estou ansioso para ver como isso vai mudar o mundo da IA. Mal posso esperar para testar! 🚀

HenryWalker

23 de Abril de 2025 à0 00:00:00 GMT

Модель s1 за менее чем 50 долларов - это безумие! Соперничать с моделью OpenAI за такую цену - это революция. Жду не дождусь увидеть, как это изменит мир ИИ. Хочу попробовать! 🚀

Principais notícias

O OpenAI aprimora o assistente de voz da IA para bate -papos melhores Experimente as palavras cruzadas de E/S da IA: uma reviravolta moderna no jogo clássico de palavras Ai computando para consumir poder de múltiplos NYCs até 2026, diz o fundador Notebooklm se expande globalmente, adiciona slides e verificação de fatos aprimorada O CEO da NVIDIA esclarece conceitos errôneos sobre o impacto do mercado de Deepseek Coréia do Sul interrompe downloads de aplicativos Deepseek em lojas locais A Adobe revela 10 agentes especializados de IA: Descubra seus aplicativos de negócios Uso de energia do ChatGPT mais baixo do que o esperado O modelo O3 do OpenAI potencialmente mais caro de operar do que se pensava inicialmente Notebooklm adiciona o recurso de descoberta de fontes web

Mais

Apresentou