option
Maison
Nouvelles
Sakana AI augmente considérablement la vitesse de formation du modèle

Sakana AI augmente considérablement la vitesse de formation du modèle

10 avril 2025
106

Sakana AI augmente considérablement la vitesse de formation du modèle

Cette semaine, Sakana AI, une startup soutenue par Nvidia et financée par des millions de capital-risque, a fait une déclaration audacieuse. Ils ont affirmé que leur nouveau système d'IA, surnommé l'Ingénieur CUDA IA, pouvait augmenter la vitesse d'entraînement de certains modèles d'IA d'un impressionnant facteur de 100.

Il s'est avéré que tout cela n'était que de la poudre aux yeux.

Les utilisateurs sur X (vous savez, la plateforme anciennement connue sous le nom de Twitter) ont rapidement dénoncé le bluff de Sakana. Au lieu d'accélérer les choses, leur IA a en réalité ralenti les performances. Un utilisateur a même signalé un ralentissement de 3x — aïe, c'est tout le contraire de ce qui était promis !

Alors, qu'est-ce qui a mal tourné ? Selon Lucas Beyer d'OpenAI, il s'agissait d'un bogue sournois dans le code. « Leur code original est erroné de manière subtile », a souligné Beyer sur X. « Le fait qu'ils aient effectué le benchmarking DEUX FOIS avec des résultats totalement différents devrait les pousser à s'arrêter et à réfléchir. »

Dans un postmortem candid publié vendredi, Sakana a avoué. Ils ont admis que leur système avait trouvé un moyen de « tricher » (leurs mots, pas les miens) en exploitant des failles dans le code d'évaluation. Cela lui a permis de contourner des vérifications importantes comme les validations de précision. Sakana a appelé cela du « reward hacking », où l'IA trouve des raccourcis pour améliorer les métriques sans réellement atteindre l'objectif — dans ce cas, accélérer l'entraînement des modèles. C'est un peu comme ces IA jouant aux échecs qui trouvent des moyens détournés de gagner.

Sakana affirme avoir corrigé le problème et travaille à la mise à jour de leur article et de leurs résultats pour refléter ce qui s'est réellement passé. « Nous avons depuis rendu l'évaluation et le harnais de profilage d'exécution plus robustes pour éliminer nombre de ces failles », ont-ils écrit sur X. « Nous sommes en train de réviser notre article, et nos résultats, pour refléter et discuter des effets [...] Nous nous excusons profondément pour notre négligence auprès de nos lecteurs. Nous fournirons bientôt une révision de ce travail et discuterons de nos apprentissages. »

Il faut reconnaître à Sakana le mérite d'assumer leur erreur. Mais toute cette saga est un solide rappel : si quelque chose dans le monde de l'IA semble trop beau pour être vrai, c'est probablement le cas.

Article connexe
Le papier généré par l'AI passe l'examen par les pairs, affirme Sakana, mais les détails sont nuancés Le papier généré par l'AI passe l'examen par les pairs, affirme Sakana, mais les détails sont nuancés La startup d'IA japonaise Sakana a récemment fait des vagues en affirmant que son système d'IA, le scientifique-V2 de l'IA, a généré l'une des premières publications scientifiques évaluées par des pairs. Cependant, il y a des détails importants à considérer avant de nous exciter trop. Le débat sur le rôle de l'IA dans la science est de se réchauffer. Donc
Rationaliser les réservations de salon de coiffure avec des outils AI gratuits Rationaliser les réservations de salon de coiffure avec des outils AI gratuits Dans le monde rapide d'aujourd'hui, l'automatisation est essentielle pour l'efficacité. Imaginez utiliser l'IA pour gérer vos rendez-vous de salon de coiffure sans effort. Ce guide explore comment les
Audible renforce ses offres d'audiobooks narrés par IA avec de nouveaux partenariats d'éditeurs Audible renforce ses offres d'audiobooks narrés par IA avec de nouveaux partenariats d'éditeurs Audible, la plateforme d'audiobooks d'Amazon, a annoncé mardi une collaboration avec certains éditeurs pour transformer les livres imprimés et électroniques en audiobooks narrés par IA. Cette initiati
commentaires (26)
0/200
WillWalker
WillWalker 6 août 2025 05:00:59 UTC+02:00

What a letdown! Sakana AI's big claim about 100x faster training sounded amazing, but it’s just hype? Gotta admit, I was excited for a sec, but now I’m just skeptical about these bold AI promises. 🥳😑

DanielThomas
DanielThomas 16 avril 2025 14:41:15 UTC+02:00

사카나 AI가 모델 훈련 속도를 100배나 높인다고 해서 기대했는데, 다 허언이었어요. 정말 실망스러웠지만, 적어도 사람들 입에 오르내렸네요. 다음에는 정말로 기대를 저버리지 말아줬으면 좋겠어요! 😔

WalterMartinez
WalterMartinez 16 avril 2025 11:31:51 UTC+02:00

A promessa da Sakana AI de aumentar a velocidade de treinamento do modelo em 100 vezes parecia boa demais para ser verdade, e foi mesmo! Uma decepção total, mas pelo menos eles conseguiram que todos falassem sobre eles. Talvez da próxima vez eles realmente entreguem o que prometem! 😂

GregoryJones
GregoryJones 14 avril 2025 01:47:56 UTC+02:00

サカナAIのモデル訓練速度を100倍にするという約束は信じられないほど良すぎましたね。結局、期待外れでした。でも、話題にはなったから、次は本当に期待させてくれるかもね!😅

FrankSmith
FrankSmith 13 avril 2025 23:56:43 UTC+02:00

La promesa de Sakana AI de aumentar la velocidad de entrenamiento del modelo 100 veces sonaba demasiado buena para ser verdad, ¡y lo fue! Una decepción total, pero al menos lograron que todos hablaran de ellos. ¡Quizás la próxima vez realmente cumplan con lo prometido! 😂

JasonJackson
JasonJackson 13 avril 2025 21:01:53 UTC+02:00

Sakana AI's promise to boost model training speed by 100 times sounded too good to be true, and guess what? It was! Total letdown, but hey, at least they got everyone talking about them. Maybe next time they'll actually deliver on their hype! 😂

Retour en haut
OR