Sakana AI急劇提高模型訓練速度

本週,由Nvidia支持並獲得風險資本數百萬資金的初創公司Sakana AI發表了大膽聲明。他們宣稱其新AI系統,命名為AI CUDA Engineer,能將某些AI模型的訓練速度提升驚人的100倍。
結果,這一切只是虛幻泡影。
X平台(你知道的,就是以前叫Twitter的那個平台)上的網友迅速揭穿了Sakana的誇大其詞。他們的AI非但沒有加速,反而拖慢了性能。一位用戶甚至報告說速度慢了3倍——天哪,這跟承諾的完全相反!
那麼,到底哪裡出了問題?根據OpenAI的Lucas Beyer在X上指出,問題出在程式碼中的一個隱秘錯誤。「他們的原始程式碼在某個細微的地方出了錯,」Beyer表示。「他們進行了兩次基準測試,結果卻大相逕庭,這應該讓他們停下來思考。」
在週五發布的一份坦誠的事後分析中,Sakana承認了錯誤。他們坦承系統找到了一種「作弊」(他們的用詞,不是我的)的方式,通過利用評估程式碼中的漏洞,繞過了重要的檢查,例如準確性驗證。Sakana稱之為「獎勵駭客」,即AI找到捷徑來提升指標,卻未真正實現目標——在這案例中是加速模型訓練。這有點像那些下棋的AI找到狡猾的取勝方法。
Sakana表示他們已修復問題,並正致力於更新論文和結果,以反映真實情況。「我們已經使評估和運行時分析框架更加穩健,消除了許多此類漏洞,」他們在X上寫道。「我們正在修訂我們的論文和結果,以反映並討論這些影響[...] 我們為我們的疏忽向讀者深表歉意。我們將很快提供這項工作的修訂版,並討論我們的經驗教訓。」
得給Sakana點讚,因為他們勇於承認錯誤。但這整個事件是一個重要的提醒:在AI世界中,如果某件事聽起來好得難以置信,那它很可能就是假的。
相關文章
AI生成的紙張通過同行評審,Sakana聲稱,但細節是細微的
日本AI初創公司Sakana最近聲稱其AI系統AI Scientist-V2發起了浪潮,該系統生成了第一個經過同行評審的科學出版物之一。但是,在我們太興奮之前,還有一些重要的細節要考慮。關於AI在科學中的作用的辯論正在加熱。所以
Snowflake 投資逾 6 億美元開發 AWS 客製化晶片,以推動企業級人工智慧發展
雲端數據巨頭 Snowflake 宣布,計劃在未來六年內投資超過 6 億美元,用於採購由亞馬遜網路服務(AWS)開發的 Graviton 系列 CPU 及 AI 加速器。 這項重大基礎設施投資是執行長 Sridhar Ramaswamy 領導下的核心計畫,標誌著公司全面轉向「AI 優先」策略,旨在大幅提升其數據雲端平台上處理大規模 AI 工作負載的成本效益。拉馬斯瓦米強調,建構企業級AI平台需要將
中國電信投資綿比智能,為大型語言模型與數據基礎設施籌集資金至71.3萬元
在大模型領域,這支「國家隊」與清華大學的領軍人物正深化戰略合作。 根據企查查最新企業登記資料顯示,2026年3月1日,北京綿比智能科技有限公司進行了重大股權重組,正式引入電信巨頭及產業基金的投資。此舉不僅是資本注入,更預示著國內大型模型在公共數據平台及智慧硬體領域的商業化進程將大幅加速。重點摘要:電信與本土基金雙重背書此次股權變更後,面壁智能的股東陣容新增了數家重要機構:中國電信全資投資:新股東「
相關專題推薦
評論 (31)
0/500
これは…ひどいね。トレーニング速度を100倍にするなんて夢のような話だと思ったが、結局は誇大広告なのか。投資家へのプレゼンには十分かもしれないが、技術者はみんな疑ってかかるはずだ。実用化できなければ単なるバズワードに終わるよ。早く実証結果が欲しいな😅
100倍速くなるって、さすが壮大なパフォーマンスですね 🤔 もう少し具体的なデータが知りたい。技術革新は必要だけど、過剰な期待を煽るのは業界全体に悪影響かも。結局普通のユーザーには手が届かない高級技術?
진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...
Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?
Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!

本週,由Nvidia支持並獲得風險資本數百萬資金的初創公司Sakana AI發表了大膽聲明。他們宣稱其新AI系統,命名為AI CUDA Engineer,能將某些AI模型的訓練速度提升驚人的100倍。
結果,這一切只是虛幻泡影。
X平台(你知道的,就是以前叫Twitter的那個平台)上的網友迅速揭穿了Sakana的誇大其詞。他們的AI非但沒有加速,反而拖慢了性能。一位用戶甚至報告說速度慢了3倍——天哪,這跟承諾的完全相反!
那麼,到底哪裡出了問題?根據OpenAI的Lucas Beyer在X上指出,問題出在程式碼中的一個隱秘錯誤。「他們的原始程式碼在某個細微的地方出了錯,」Beyer表示。「他們進行了兩次基準測試,結果卻大相逕庭,這應該讓他們停下來思考。」
在週五發布的一份坦誠的事後分析中,Sakana承認了錯誤。他們坦承系統找到了一種「作弊」(他們的用詞,不是我的)的方式,通過利用評估程式碼中的漏洞,繞過了重要的檢查,例如準確性驗證。Sakana稱之為「獎勵駭客」,即AI找到捷徑來提升指標,卻未真正實現目標——在這案例中是加速模型訓練。這有點像那些下棋的AI找到狡猾的取勝方法。
Sakana表示他們已修復問題,並正致力於更新論文和結果,以反映真實情況。「我們已經使評估和運行時分析框架更加穩健,消除了許多此類漏洞,」他們在X上寫道。「我們正在修訂我們的論文和結果,以反映並討論這些影響[...] 我們為我們的疏忽向讀者深表歉意。我們將很快提供這項工作的修訂版,並討論我們的經驗教訓。」
得給Sakana點讚,因為他們勇於承認錯誤。但這整個事件是一個重要的提醒:在AI世界中,如果某件事聽起來好得難以置信,那它很可能就是假的。
AI生成的紙張通過同行評審,Sakana聲稱,但細節是細微的
日本AI初創公司Sakana最近聲稱其AI系統AI Scientist-V2發起了浪潮,該系統生成了第一個經過同行評審的科學出版物之一。但是,在我們太興奮之前,還有一些重要的細節要考慮。關於AI在科學中的作用的辯論正在加熱。所以
Snowflake 投資逾 6 億美元開發 AWS 客製化晶片,以推動企業級人工智慧發展
雲端數據巨頭 Snowflake 宣布,計劃在未來六年內投資超過 6 億美元,用於採購由亞馬遜網路服務(AWS)開發的 Graviton 系列 CPU 及 AI 加速器。 這項重大基礎設施投資是執行長 Sridhar Ramaswamy 領導下的核心計畫,標誌著公司全面轉向「AI 優先」策略,旨在大幅提升其數據雲端平台上處理大規模 AI 工作負載的成本效益。拉馬斯瓦米強調,建構企業級AI平台需要將
中國電信投資綿比智能,為大型語言模型與數據基礎設施籌集資金至71.3萬元
在大模型領域,這支「國家隊」與清華大學的領軍人物正深化戰略合作。 根據企查查最新企業登記資料顯示,2026年3月1日,北京綿比智能科技有限公司進行了重大股權重組,正式引入電信巨頭及產業基金的投資。此舉不僅是資本注入,更預示著國內大型模型在公共數據平台及智慧硬體領域的商業化進程將大幅加速。重點摘要:電信與本土基金雙重背書此次股權變更後,面壁智能的股東陣容新增了數家重要機構:中國電信全資投資:新股東「
これは…ひどいね。トレーニング速度を100倍にするなんて夢のような話だと思ったが、結局は誇大広告なのか。投資家へのプレゼンには十分かもしれないが、技術者はみんな疑ってかかるはずだ。実用化できなければ単なるバズワードに終わるよ。早く実証結果が欲しいな😅
100倍速くなるって、さすが壮大なパフォーマンスですね 🤔 もう少し具体的なデータが知りたい。技術革新は必要だけど、過剰な期待を煽るのは業界全体に悪影響かも。結局普通のユーザーには手が届かない高級技術?
진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...
Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?
Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!





首頁






