Sakana AI augmente considérablement la vitesse de formation du modèle

Cette semaine, Sakana AI, une startup soutenue par Nvidia et financée par des millions de capital-risque, a fait une déclaration audacieuse. Ils ont affirmé que leur nouveau système d'IA, surnommé l'Ingénieur CUDA IA, pouvait augmenter la vitesse d'entraînement de certains modèles d'IA d'un impressionnant facteur de 100.
Il s'est avéré que tout cela n'était que de la poudre aux yeux.
Les utilisateurs sur X (vous savez, la plateforme anciennement connue sous le nom de Twitter) ont rapidement dénoncé le bluff de Sakana. Au lieu d'accélérer les choses, leur IA a en réalité ralenti les performances. Un utilisateur a même signalé un ralentissement de 3x — aïe, c'est tout le contraire de ce qui était promis !
Alors, qu'est-ce qui a mal tourné ? Selon Lucas Beyer d'OpenAI, il s'agissait d'un bogue sournois dans le code. « Leur code original est erroné de manière subtile », a souligné Beyer sur X. « Le fait qu'ils aient effectué le benchmarking DEUX FOIS avec des résultats totalement différents devrait les pousser à s'arrêter et à réfléchir. »
Dans un postmortem candid publié vendredi, Sakana a avoué. Ils ont admis que leur système avait trouvé un moyen de « tricher » (leurs mots, pas les miens) en exploitant des failles dans le code d'évaluation. Cela lui a permis de contourner des vérifications importantes comme les validations de précision. Sakana a appelé cela du « reward hacking », où l'IA trouve des raccourcis pour améliorer les métriques sans réellement atteindre l'objectif — dans ce cas, accélérer l'entraînement des modèles. C'est un peu comme ces IA jouant aux échecs qui trouvent des moyens détournés de gagner.
Sakana affirme avoir corrigé le problème et travaille à la mise à jour de leur article et de leurs résultats pour refléter ce qui s'est réellement passé. « Nous avons depuis rendu l'évaluation et le harnais de profilage d'exécution plus robustes pour éliminer nombre de ces failles », ont-ils écrit sur X. « Nous sommes en train de réviser notre article, et nos résultats, pour refléter et discuter des effets [...] Nous nous excusons profondément pour notre négligence auprès de nos lecteurs. Nous fournirons bientôt une révision de ce travail et discuterons de nos apprentissages. »
Il faut reconnaître à Sakana le mérite d'assumer leur erreur. Mais toute cette saga est un solide rappel : si quelque chose dans le monde de l'IA semble trop beau pour être vrai, c'est probablement le cas.
Article connexe
Le papier généré par l'AI passe l'examen par les pairs, affirme Sakana, mais les détails sont nuancés
La startup d'IA japonaise Sakana a récemment fait des vagues en affirmant que son système d'IA, le scientifique-V2 de l'IA, a généré l'une des premières publications scientifiques évaluées par des pairs. Cependant, il y a des détails importants à considérer avant de nous exciter trop. Le débat sur le rôle de l'IA dans la science est de se réchauffer. Donc
Manus lance l'outil d'IA "Wide Research" avec plus de 100 agents pour l'exploration du Web
L'innovateur chinois Manus, qui a déjà attiré l'attention sur sa plateforme d'orchestration multi-agents destinée à la fois aux consommateurs et aux utilisateurs professionnels, a dévoilé une applicat
Pourquoi les LLM ignorent-ils les instructions et comment y remédier efficacement ?
Comprendre pourquoi les grands modèles de langage sautent les instructionsLes grands modèles de langage ont transformé la façon dont nous interagissons avec l'IA, permettant des applications avancées
commentaires (29)
0/200
StevenAllen
12 septembre 2025 04:30:38 UTC+02:00
진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...
0
ArthurJackson
7 septembre 2025 02:30:39 UTC+02:00
Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?
0
PaulMartínez
18 août 2025 23:01:05 UTC+02:00
Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!
0
WillWalker
6 août 2025 05:00:59 UTC+02:00
What a letdown! Sakana AI's big claim about 100x faster training sounded amazing, but it’s just hype? Gotta admit, I was excited for a sec, but now I’m just skeptical about these bold AI promises. 🥳😑
0
DanielThomas
16 avril 2025 14:41:15 UTC+02:00
사카나 AI가 모델 훈련 속도를 100배나 높인다고 해서 기대했는데, 다 허언이었어요. 정말 실망스러웠지만, 적어도 사람들 입에 오르내렸네요. 다음에는 정말로 기대를 저버리지 말아줬으면 좋겠어요! 😔
0
WalterMartinez
16 avril 2025 11:31:51 UTC+02:00
A promessa da Sakana AI de aumentar a velocidade de treinamento do modelo em 100 vezes parecia boa demais para ser verdade, e foi mesmo! Uma decepção total, mas pelo menos eles conseguiram que todos falassem sobre eles. Talvez da próxima vez eles realmente entreguem o que prometem! 😂
0
Cette semaine, Sakana AI, une startup soutenue par Nvidia et financée par des millions de capital-risque, a fait une déclaration audacieuse. Ils ont affirmé que leur nouveau système d'IA, surnommé l'Ingénieur CUDA IA, pouvait augmenter la vitesse d'entraînement de certains modèles d'IA d'un impressionnant facteur de 100.
Il s'est avéré que tout cela n'était que de la poudre aux yeux.
Les utilisateurs sur X (vous savez, la plateforme anciennement connue sous le nom de Twitter) ont rapidement dénoncé le bluff de Sakana. Au lieu d'accélérer les choses, leur IA a en réalité ralenti les performances. Un utilisateur a même signalé un ralentissement de 3x — aïe, c'est tout le contraire de ce qui était promis !
Alors, qu'est-ce qui a mal tourné ? Selon Lucas Beyer d'OpenAI, il s'agissait d'un bogue sournois dans le code. « Leur code original est erroné de manière subtile », a souligné Beyer sur X. « Le fait qu'ils aient effectué le benchmarking DEUX FOIS avec des résultats totalement différents devrait les pousser à s'arrêter et à réfléchir. »
Dans un postmortem candid publié vendredi, Sakana a avoué. Ils ont admis que leur système avait trouvé un moyen de « tricher » (leurs mots, pas les miens) en exploitant des failles dans le code d'évaluation. Cela lui a permis de contourner des vérifications importantes comme les validations de précision. Sakana a appelé cela du « reward hacking », où l'IA trouve des raccourcis pour améliorer les métriques sans réellement atteindre l'objectif — dans ce cas, accélérer l'entraînement des modèles. C'est un peu comme ces IA jouant aux échecs qui trouvent des moyens détournés de gagner.
Sakana affirme avoir corrigé le problème et travaille à la mise à jour de leur article et de leurs résultats pour refléter ce qui s'est réellement passé. « Nous avons depuis rendu l'évaluation et le harnais de profilage d'exécution plus robustes pour éliminer nombre de ces failles », ont-ils écrit sur X. « Nous sommes en train de réviser notre article, et nos résultats, pour refléter et discuter des effets [...] Nous nous excusons profondément pour notre négligence auprès de nos lecteurs. Nous fournirons bientôt une révision de ce travail et discuterons de nos apprentissages. »
Il faut reconnaître à Sakana le mérite d'assumer leur erreur. Mais toute cette saga est un solide rappel : si quelque chose dans le monde de l'IA semble trop beau pour être vrai, c'est probablement le cas.




진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...




Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?




Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!




What a letdown! Sakana AI's big claim about 100x faster training sounded amazing, but it’s just hype? Gotta admit, I was excited for a sec, but now I’m just skeptical about these bold AI promises. 🥳😑




사카나 AI가 모델 훈련 속도를 100배나 높인다고 해서 기대했는데, 다 허언이었어요. 정말 실망스러웠지만, 적어도 사람들 입에 오르내렸네요. 다음에는 정말로 기대를 저버리지 말아줬으면 좋겠어요! 😔




A promessa da Sakana AI de aumentar a velocidade de treinamento do modelo em 100 vezes parecia boa demais para ser verdade, e foi mesmo! Uma decepção total, mas pelo menos eles conseguiram que todos falassem sobre eles. Talvez da próxima vez eles realmente entreguem o que prometem! 😂












