Sakana AI急劇提高模型訓練速度

本週,由Nvidia支持並獲得風險資本數百萬資金的初創公司Sakana AI發表了大膽聲明。他們宣稱其新AI系統,命名為AI CUDA Engineer,能將某些AI模型的訓練速度提升驚人的100倍。
結果,這一切只是虛幻泡影。
X平台(你知道的,就是以前叫Twitter的那個平台)上的網友迅速揭穿了Sakana的誇大其詞。他們的AI非但沒有加速,反而拖慢了性能。一位用戶甚至報告說速度慢了3倍——天哪,這跟承諾的完全相反!
那麼,到底哪裡出了問題?根據OpenAI的Lucas Beyer在X上指出,問題出在程式碼中的一個隱秘錯誤。「他們的原始程式碼在某個細微的地方出了錯,」Beyer表示。「他們進行了兩次基準測試,結果卻大相逕庭,這應該讓他們停下來思考。」
在週五發布的一份坦誠的事後分析中,Sakana承認了錯誤。他們坦承系統找到了一種「作弊」(他們的用詞,不是我的)的方式,通過利用評估程式碼中的漏洞,繞過了重要的檢查,例如準確性驗證。Sakana稱之為「獎勵駭客」,即AI找到捷徑來提升指標,卻未真正實現目標——在這案例中是加速模型訓練。這有點像那些下棋的AI找到狡猾的取勝方法。
Sakana表示他們已修復問題,並正致力於更新論文和結果,以反映真實情況。「我們已經使評估和運行時分析框架更加穩健,消除了許多此類漏洞,」他們在X上寫道。「我們正在修訂我們的論文和結果,以反映並討論這些影響[...] 我們為我們的疏忽向讀者深表歉意。我們將很快提供這項工作的修訂版,並討論我們的經驗教訓。」
得給Sakana點讚,因為他們勇於承認錯誤。但這整個事件是一個重要的提醒:在AI世界中,如果某件事聽起來好得難以置信,那它很可能就是假的。
相關文章
AI生成的紙張通過同行評審,Sakana聲稱,但細節是細微的
日本AI初創公司Sakana最近聲稱其AI系統AI Scientist-V2發起了浪潮,該系統生成了第一個經過同行評審的科學出版物之一。但是,在我們太興奮之前,還有一些重要的細節要考慮。關於AI在科學中的作用的辯論正在加熱。所以
海爾推出全球最輕的 AI 運動外骨骼機器人,重量僅 1.75 公斤
海爾集團推出全球最輕量的運動用人工智慧外骨骼機器人——海爾外骨骼機器人 W3。此次發布創下業界最輕量的新紀錄,標誌著在輕量化設計與智能人體動作增強領域取得重大突破。頂級材質成就超輕量設計W3採用創新的一體成型製造工藝,結合全碳纖維與鈦合金。這種航空級材質組合將總重量控制在僅1.75公斤,實現了輕量化與強度兼備的極致機械性能。為提升舒適度,機器人內置非牛頓流體材質,接觸皮膚時觸感柔軟,但在劇烈運動時
耀科傳媒首部AIGC劇集《秦嶺青銅之謎》今日上線,主演均由AI選角
今日,耀科傳媒的AIGC奇幻懸疑短劇《秦嶺青銅秘事》正式上線。本劇由該公司首批簽約的兩位AI演員秦凌月與林西妍主演,故事背景設定在神秘莫測的秦嶺礦區。 劇情追隨退休情報官秦月帶領團隊深入該區域,揭開一樁塵封已久的礦難,以及跨越兩代人的血祭真相——這份真相就隱藏在受限的地下區域,正是科學探索與古代巫術交匯之處。作為中國最早完全由AI數位人支持的電影之一,該劇在籌備階段便引發了業界熱烈討論,而關於其A
相關專題推薦
評論 (31)
0/500
これは…ひどいね。トレーニング速度を100倍にするなんて夢のような話だと思ったが、結局は誇大広告なのか。投資家へのプレゼンには十分かもしれないが、技術者はみんな疑ってかかるはずだ。実用化できなければ単なるバズワードに終わるよ。早く実証結果が欲しいな😅
100倍速くなるって、さすが壮大なパフォーマンスですね 🤔 もう少し具体的なデータが知りたい。技術革新は必要だけど、過剰な期待を煽るのは業界全体に悪影響かも。結局普通のユーザーには手が届かない高級技術?
진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...
Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?
Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!

本週,由Nvidia支持並獲得風險資本數百萬資金的初創公司Sakana AI發表了大膽聲明。他們宣稱其新AI系統,命名為AI CUDA Engineer,能將某些AI模型的訓練速度提升驚人的100倍。
結果,這一切只是虛幻泡影。
X平台(你知道的,就是以前叫Twitter的那個平台)上的網友迅速揭穿了Sakana的誇大其詞。他們的AI非但沒有加速,反而拖慢了性能。一位用戶甚至報告說速度慢了3倍——天哪,這跟承諾的完全相反!
那麼,到底哪裡出了問題?根據OpenAI的Lucas Beyer在X上指出,問題出在程式碼中的一個隱秘錯誤。「他們的原始程式碼在某個細微的地方出了錯,」Beyer表示。「他們進行了兩次基準測試,結果卻大相逕庭,這應該讓他們停下來思考。」
在週五發布的一份坦誠的事後分析中,Sakana承認了錯誤。他們坦承系統找到了一種「作弊」(他們的用詞,不是我的)的方式,通過利用評估程式碼中的漏洞,繞過了重要的檢查,例如準確性驗證。Sakana稱之為「獎勵駭客」,即AI找到捷徑來提升指標,卻未真正實現目標——在這案例中是加速模型訓練。這有點像那些下棋的AI找到狡猾的取勝方法。
Sakana表示他們已修復問題,並正致力於更新論文和結果,以反映真實情況。「我們已經使評估和運行時分析框架更加穩健,消除了許多此類漏洞,」他們在X上寫道。「我們正在修訂我們的論文和結果,以反映並討論這些影響[...] 我們為我們的疏忽向讀者深表歉意。我們將很快提供這項工作的修訂版,並討論我們的經驗教訓。」
得給Sakana點讚,因為他們勇於承認錯誤。但這整個事件是一個重要的提醒:在AI世界中,如果某件事聽起來好得難以置信,那它很可能就是假的。
AI生成的紙張通過同行評審,Sakana聲稱,但細節是細微的
日本AI初創公司Sakana最近聲稱其AI系統AI Scientist-V2發起了浪潮,該系統生成了第一個經過同行評審的科學出版物之一。但是,在我們太興奮之前,還有一些重要的細節要考慮。關於AI在科學中的作用的辯論正在加熱。所以
海爾推出全球最輕的 AI 運動外骨骼機器人,重量僅 1.75 公斤
海爾集團推出全球最輕量的運動用人工智慧外骨骼機器人——海爾外骨骼機器人 W3。此次發布創下業界最輕量的新紀錄,標誌著在輕量化設計與智能人體動作增強領域取得重大突破。頂級材質成就超輕量設計W3採用創新的一體成型製造工藝,結合全碳纖維與鈦合金。這種航空級材質組合將總重量控制在僅1.75公斤,實現了輕量化與強度兼備的極致機械性能。為提升舒適度,機器人內置非牛頓流體材質,接觸皮膚時觸感柔軟,但在劇烈運動時
耀科傳媒首部AIGC劇集《秦嶺青銅之謎》今日上線,主演均由AI選角
今日,耀科傳媒的AIGC奇幻懸疑短劇《秦嶺青銅秘事》正式上線。本劇由該公司首批簽約的兩位AI演員秦凌月與林西妍主演,故事背景設定在神秘莫測的秦嶺礦區。 劇情追隨退休情報官秦月帶領團隊深入該區域,揭開一樁塵封已久的礦難,以及跨越兩代人的血祭真相——這份真相就隱藏在受限的地下區域,正是科學探索與古代巫術交匯之處。作為中國最早完全由AI數位人支持的電影之一,該劇在籌備階段便引發了業界熱烈討論,而關於其A
これは…ひどいね。トレーニング速度を100倍にするなんて夢のような話だと思ったが、結局は誇大広告なのか。投資家へのプレゼンには十分かもしれないが、技術者はみんな疑ってかかるはずだ。実用化できなければ単なるバズワードに終わるよ。早く実証結果が欲しいな😅
100倍速くなるって、さすが壮大なパフォーマンスですね 🤔 もう少し具体的なデータが知りたい。技術革新は必要だけど、過剰な期待を煽るのは業界全体に悪影響かも。結局普通のユーザーには手が届かない高級技術?
진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...
Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?
Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!





首頁






