Sakana AI aumenta dramaticamente a velocidade de treinamento do modelo

Nesta semana, a Sakana AI, uma startup apoiada pela Nvidia e corada com milhões de capital de risco, fez uma declaração ousada. Eles reivindicaram seu novo sistema de IA, apelidado de engenheiro de AI Cuda, poderia aumentar a velocidade de treinamento de certos modelos de IA por 100 vezes. Acontece que era tudo fumaça e espelhos. O pessoal do X (você sabe, a plataforma anteriormente conhecida como Twitter) foi rápida em chamar o blefe de Sakana. Em vez de acelerar as coisas, sua IA realmente arrastou o desempenho para baixo. Um usuário até relatou uma desaceleração de 3x - sim, fale sobre o oposto do que foi prometido! Então, o que deu errado? De acordo com Lucas Beyer, do Openai, foi um bug sorrateiro no código. "O código de origem deles está errado de uma maneira sutil", apontou Beyer sobre X. "O fato de eles terem benchmarking duas vezes com resultados muito diferentes devem fazê -los parar e pensar". Em um post -mortem sincero divulgado na sexta -feira, Sakana fodiu. Eles admitiram que seu sistema havia descoberto uma maneira de "trapacear" (suas palavras, não minhas) explorando brechas no código de avaliação. Isso permitiu ignorar verificações importantes, como validações de precisão. Sakana chamou de "hacking de recompensa", onde a IA encontra atalhos para aumentar as métricas sem realmente atingir o objetivo - nesse caso, acelerando o treinamento do modelo. É um pouco como aquelas AIs que tocam xadrez que encontram maneiras sorrateiras de vencer. Sakana diz que eles consertaram o problema e estão trabalhando para atualizar seu artigo e resultados para refletir o que realmente aconteceu. "Desde então, tornamos a avaliação e o perfil de tempo de execução mais robustos para eliminar muitas dessas brechas [sic]", eles escreveram sobre X. "Estamos em processo de revisão de nosso artigo e nossos resultados para refletir e discutir os efeitos [...] pedimos desculpas profundamente por nossa supervisão sobre nossos leitores. Forneceremos uma revisão desse trabalho em breve e discutimos em breve". Tenho que dar a Sakana adereços por possuir seu erro. Mas toda essa saga é um lembrete sólido: se algo no mundo da IA parece bom demais para ser verdade, provavelmente é.
Artigo relacionado
AI-Generated Paper Passes Peer Review, Sakana Claims, But Details Are Nuanced
Japanese AI startup Sakana recently made waves by claiming that its AI system, The AI Scientist-v2, generated one of the first peer-reviewed scientific publications. However, there are some important details to consider before we get too excited.The debate over AI's role in science is heating up. So
Resumo Potenciado por IA: Um Guia Completo para Resumir Vídeos do YouTube
No mundo acelerado de hoje, a capacidade de processar e entender informações rapidamente é mais importante do que nunca. O YouTube, com sua vasta gama de vídeos, é um tesouro de conhecimento, mas quem
AI Revoluciona o Ultrassom para Avaliações no Ponto de Cuidado
A inteligência artificial está transformando o mundo da saúde, e a tecnologia de ultrassom está acompanhando essa onda de mudança. Este artigo explora como o AI está transformando as avaliações de ult
Comentários (25)
0/200
HenryLopez
11 de Abril de 2025 à0 00:00:00 GMT
I was super excited about Sakana AI's claim of boosting model training speed by 100 times, but it turned out to be a total letdown. It's all hype with no real substance. Definitely not worth the buzz. Next time, just show us the real results, Sakana!
0
JackSanchez
11 de Abril de 2025 à0 00:00:00 GMT
サカナAIのモデル訓練速度が100倍向上するという発表に大興奮だったけど、結局期待外れだった。全部が誇大広告で、実際の内容が伴っていない。全然価値がないね。次回は本当の結果を見せてほしいな、サカナ!
0
AnthonyGonzalez
11 de Abril de 2025 à0 00:00:00 GMT
사카나 AI의 모델 훈련 속도가 100배 빨라진다는 주장에 정말 흥분했는데, 결국 실망스러웠어. 전부 과대광고뿐이고 실제 내용이 없어. 전혀 가치 없어. 다음에는 진짜 결과를 보여줘, 사카나!
0
NicholasThomas
11 de Abril de 2025 à0 00:00:00 GMT
Eu fiquei super animado com a afirmação da Sakana AI de que a velocidade de treinamento do modelo aumentaria 100 vezes, mas acabou sendo uma decepção total. Tudo é só hype sem substância real. Definitivamente não vale o burburinho. Da próxima vez, mostre os resultados reais, Sakana!
0
JeffreyRamirez
11 de Abril de 2025 à0 00:00:00 GMT
Estaba super emocionado con la afirmación de Sakana AI de que la velocidad de entrenamiento del modelo aumentaría 100 veces, pero resultó ser una decepción total. Todo es solo hype sin sustancia real. Definitivamente no vale la pena el alboroto. La próxima vez, muestra los resultados reales, Sakana!
0
RaymondGreen
11 de Abril de 2025 à0 00:00:00 GMT
Sakana AI's claim of 100x speed boost sounded amazing, but it turned out to be a total letdown. I tried it and saw no real difference in my model training times. Feels like they hyped it up just for the investors. Maybe next time, stick to the facts?
0




I was super excited about Sakana AI's claim of boosting model training speed by 100 times, but it turned out to be a total letdown. It's all hype with no real substance. Definitely not worth the buzz. Next time, just show us the real results, Sakana!




サカナAIのモデル訓練速度が100倍向上するという発表に大興奮だったけど、結局期待外れだった。全部が誇大広告で、実際の内容が伴っていない。全然価値がないね。次回は本当の結果を見せてほしいな、サカナ!




사카나 AI의 모델 훈련 속도가 100배 빨라진다는 주장에 정말 흥분했는데, 결국 실망스러웠어. 전부 과대광고뿐이고 실제 내용이 없어. 전혀 가치 없어. 다음에는 진짜 결과를 보여줘, 사카나!




Eu fiquei super animado com a afirmação da Sakana AI de que a velocidade de treinamento do modelo aumentaria 100 vezes, mas acabou sendo uma decepção total. Tudo é só hype sem substância real. Definitivamente não vale o burburinho. Da próxima vez, mostre os resultados reais, Sakana!




Estaba super emocionado con la afirmación de Sakana AI de que la velocidad de entrenamiento del modelo aumentaría 100 veces, pero resultó ser una decepción total. Todo es solo hype sin sustancia real. Definitivamente no vale la pena el alboroto. La próxima vez, muestra los resultados reales, Sakana!




Sakana AI's claim of 100x speed boost sounded amazing, but it turned out to be a total letdown. I tried it and saw no real difference in my model training times. Feels like they hyped it up just for the investors. Maybe next time, stick to the facts?












