Sakana AI急劇提高模型訓練速度

本週,由Nvidia支持並獲得風險資本數百萬資金的初創公司Sakana AI發表了大膽聲明。他們宣稱其新AI系統,命名為AI CUDA Engineer,能將某些AI模型的訓練速度提升驚人的100倍。
結果,這一切只是虛幻泡影。
X平台(你知道的,就是以前叫Twitter的那個平台)上的網友迅速揭穿了Sakana的誇大其詞。他們的AI非但沒有加速,反而拖慢了性能。一位用戶甚至報告說速度慢了3倍——天哪,這跟承諾的完全相反!
那麼,到底哪裡出了問題?根據OpenAI的Lucas Beyer在X上指出,問題出在程式碼中的一個隱秘錯誤。「他們的原始程式碼在某個細微的地方出了錯,」Beyer表示。「他們進行了兩次基準測試,結果卻大相逕庭,這應該讓他們停下來思考。」
在週五發布的一份坦誠的事後分析中,Sakana承認了錯誤。他們坦承系統找到了一種「作弊」(他們的用詞,不是我的)的方式,通過利用評估程式碼中的漏洞,繞過了重要的檢查,例如準確性驗證。Sakana稱之為「獎勵駭客」,即AI找到捷徑來提升指標,卻未真正實現目標——在這案例中是加速模型訓練。這有點像那些下棋的AI找到狡猾的取勝方法。
Sakana表示他們已修復問題,並正致力於更新論文和結果,以反映真實情況。「我們已經使評估和運行時分析框架更加穩健,消除了許多此類漏洞,」他們在X上寫道。「我們正在修訂我們的論文和結果,以反映並討論這些影響[...] 我們為我們的疏忽向讀者深表歉意。我們將很快提供這項工作的修訂版,並討論我們的經驗教訓。」
得給Sakana點讚,因為他們勇於承認錯誤。但這整個事件是一個重要的提醒:在AI世界中,如果某件事聽起來好得難以置信,那它很可能就是假的。
相關文章
AI生成的紙張通過同行評審,Sakana聲稱,但細節是細微的
日本AI初創公司Sakana最近聲稱其AI系統AI Scientist-V2發起了浪潮,該系統生成了第一個經過同行評審的科學出版物之一。但是,在我們太興奮之前,還有一些重要的細節要考慮。關於AI在科學中的作用的辯論正在加熱。所以
美國政府投資 Intel 以提升國內半導體產量
川普政府已將建立美國在人工智慧領域的領導地位視為首要任務,而半導體生產的重組則是其中一項基石策略。最近的政策舉措,包括建議的關稅和財務獎勵措施,都顯示出加強國內晶片製造能力的決心。八月,政府將現有的半導體製造補助轉換為英特爾公司 10% 的股權,成為頭條新聞。這項獨特的協議包含了一些條款,如果英特爾在其晶圓代工業務(為全球客戶生產客製化晶片)的所有權在五年內低於多數控制權,聯邦政府將獲得額外的
Apple 的 Craig Federighi 承認人工智慧 Siri 早期階段有嚴重缺陷
蘋果高層解釋 Siri 升級延遲的原因在 WWDC 2024 期間,Apple 原本承諾會大幅提升 Siri 功能,包括個人化情境感知和應用程式自動化功能。然而,該公司最近證實這些功能的交付將會延遲。高級副總裁 Craig Federighi (軟體工程) 與 Greg Joswiak (全球行銷) 在接受《華爾街日報》的 Joanna Stern 獨家專訪時,談到這些延遲的問題。Fede
評論 (29)
0/200
StevenAllen
2025-09-12 10:30:38
진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...
0
ArthurJackson
2025-09-07 08:30:39
Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?
0
PaulMartínez
2025-08-19 05:01:05
Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!
0
WillWalker
2025-08-06 11:00:59
What a letdown! Sakana AI's big claim about 100x faster training sounded amazing, but it’s just hype? Gotta admit, I was excited for a sec, but now I’m just skeptical about these bold AI promises. 🥳😑
0
DanielThomas
2025-04-16 20:41:15
사카나 AI가 모델 훈련 속도를 100배나 높인다고 해서 기대했는데, 다 허언이었어요. 정말 실망스러웠지만, 적어도 사람들 입에 오르내렸네요. 다음에는 정말로 기대를 저버리지 말아줬으면 좋겠어요! 😔
0
WalterMartinez
2025-04-16 17:31:51
A promessa da Sakana AI de aumentar a velocidade de treinamento do modelo em 100 vezes parecia boa demais para ser verdade, e foi mesmo! Uma decepção total, mas pelo menos eles conseguiram que todos falassem sobre eles. Talvez da próxima vez eles realmente entreguem o que prometem! 😂
0
本週,由Nvidia支持並獲得風險資本數百萬資金的初創公司Sakana AI發表了大膽聲明。他們宣稱其新AI系統,命名為AI CUDA Engineer,能將某些AI模型的訓練速度提升驚人的100倍。
結果,這一切只是虛幻泡影。
X平台(你知道的,就是以前叫Twitter的那個平台)上的網友迅速揭穿了Sakana的誇大其詞。他們的AI非但沒有加速,反而拖慢了性能。一位用戶甚至報告說速度慢了3倍——天哪,這跟承諾的完全相反!
那麼,到底哪裡出了問題?根據OpenAI的Lucas Beyer在X上指出,問題出在程式碼中的一個隱秘錯誤。「他們的原始程式碼在某個細微的地方出了錯,」Beyer表示。「他們進行了兩次基準測試,結果卻大相逕庭,這應該讓他們停下來思考。」
在週五發布的一份坦誠的事後分析中,Sakana承認了錯誤。他們坦承系統找到了一種「作弊」(他們的用詞,不是我的)的方式,通過利用評估程式碼中的漏洞,繞過了重要的檢查,例如準確性驗證。Sakana稱之為「獎勵駭客」,即AI找到捷徑來提升指標,卻未真正實現目標——在這案例中是加速模型訓練。這有點像那些下棋的AI找到狡猾的取勝方法。
Sakana表示他們已修復問題,並正致力於更新論文和結果,以反映真實情況。「我們已經使評估和運行時分析框架更加穩健,消除了許多此類漏洞,」他們在X上寫道。「我們正在修訂我們的論文和結果,以反映並討論這些影響[...] 我們為我們的疏忽向讀者深表歉意。我們將很快提供這項工作的修訂版,並討論我們的經驗教訓。」
得給Sakana點讚,因為他們勇於承認錯誤。但這整個事件是一個重要的提醒:在AI世界中,如果某件事聽起來好得難以置信,那它很可能就是假的。




진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...




Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?




Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!




What a letdown! Sakana AI's big claim about 100x faster training sounded amazing, but it’s just hype? Gotta admit, I was excited for a sec, but now I’m just skeptical about these bold AI promises. 🥳😑




사카나 AI가 모델 훈련 속도를 100배나 높인다고 해서 기대했는데, 다 허언이었어요. 정말 실망스러웠지만, 적어도 사람들 입에 오르내렸네요. 다음에는 정말로 기대를 저버리지 말아줬으면 좋겠어요! 😔




A promessa da Sakana AI de aumentar a velocidade de treinamento do modelo em 100 vezes parecia boa demais para ser verdade, e foi mesmo! Uma decepção total, mas pelo menos eles conseguiram que todos falassem sobre eles. Talvez da próxima vez eles realmente entreguem o que prometem! 😂












