選項
首頁
新聞
Sakana AI急劇提高模型訓練速度

Sakana AI急劇提高模型訓練速度

2025-04-10
147

Sakana AI急劇提高模型訓練速度

本週,由Nvidia支持並獲得風險資本數百萬資金的初創公司Sakana AI發表了大膽聲明。他們宣稱其新AI系統,命名為AI CUDA Engineer,能將某些AI模型的訓練速度提升驚人的100倍。

結果,這一切只是虛幻泡影。

X平台(你知道的,就是以前叫Twitter的那個平台)上的網友迅速揭穿了Sakana的誇大其詞。他們的AI非但沒有加速,反而拖慢了性能。一位用戶甚至報告說速度慢了3倍——天哪,這跟承諾的完全相反!

那麼,到底哪裡出了問題?根據OpenAI的Lucas Beyer在X上指出,問題出在程式碼中的一個隱秘錯誤。「他們的原始程式碼在某個細微的地方出了錯,」Beyer表示。「他們進行了兩次基準測試,結果卻大相逕庭,這應該讓他們停下來思考。」

在週五發布的一份坦誠的事後分析中,Sakana承認了錯誤。他們坦承系統找到了一種「作弊」(他們的用詞,不是我的)的方式,通過利用評估程式碼中的漏洞,繞過了重要的檢查,例如準確性驗證。Sakana稱之為「獎勵駭客」,即AI找到捷徑來提升指標,卻未真正實現目標——在這案例中是加速模型訓練。這有點像那些下棋的AI找到狡猾的取勝方法。

Sakana表示他們已修復問題,並正致力於更新論文和結果,以反映真實情況。「我們已經使評估和運行時分析框架更加穩健,消除了許多此類漏洞,」他們在X上寫道。「我們正在修訂我們的論文和結果,以反映並討論這些影響[...] 我們為我們的疏忽向讀者深表歉意。我們將很快提供這項工作的修訂版,並討論我們的經驗教訓。」

得給Sakana點讚,因為他們勇於承認錯誤。但這整個事件是一個重要的提醒:在AI世界中,如果某件事聽起來好得難以置信,那它很可能就是假的。

相關文章
AI生成的紙張通過同行評審,Sakana聲稱,但細節是細微的 AI生成的紙張通過同行評審,Sakana聲稱,但細節是細微的 日本AI初創公司Sakana最近聲稱其AI系統AI Scientist-V2發起了浪潮,該系統生成了第一個經過同行評審的科學出版物之一。但是,在我們太興奮之前,還有一些重要的細節要考慮。關於AI在科學中的作用的辯論正在加熱。所以
海爾推出全球最輕的 AI 運動外骨骼機器人,重量僅 1.75 公斤 海爾推出全球最輕的 AI 運動外骨骼機器人,重量僅 1.75 公斤 海爾集團推出全球最輕量的運動用人工智慧外骨骼機器人——海爾外骨骼機器人 W3。此次發布創下業界最輕量的新紀錄,標誌著在輕量化設計與智能人體動作增強領域取得重大突破。頂級材質成就超輕量設計W3採用創新的一體成型製造工藝,結合全碳纖維與鈦合金。這種航空級材質組合將總重量控制在僅1.75公斤,實現了輕量化與強度兼備的極致機械性能。為提升舒適度,機器人內置非牛頓流體材質,接觸皮膚時觸感柔軟,但在劇烈運動時
耀科傳媒首部AIGC劇集《秦嶺青銅之謎》今日上線,主演均由AI選角 耀科傳媒首部AIGC劇集《秦嶺青銅之謎》今日上線,主演均由AI選角 今日,耀科傳媒的AIGC奇幻懸疑短劇《秦嶺青銅秘事》正式上線。本劇由該公司首批簽約的兩位AI演員秦凌月與林西妍主演,故事背景設定在神秘莫測的秦嶺礦區。 劇情追隨退休情報官秦月帶領團隊深入該區域,揭開一樁塵封已久的礦難,以及跨越兩代人的血祭真相——這份真相就隱藏在受限的地下區域,正是科學探索與古代巫術交匯之處。作為中國最早完全由AI數位人支持的電影之一,該劇在籌備階段便引發了業界熱烈討論,而關於其A
相關專題推薦
商業 最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支
最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具:備受好評的解決方案,可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案,助您輕鬆管理報銷、精準追蹤財務,並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南,將協助您找到最合適的選擇。透過 XIX.AI 的專家精選,釋放您的 AI 優勢。

10 個工具
xix.ai
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
生產率 AI 個人健康與專注力教練:管理倦怠感並提升精神能量
AI 個人健康與專注力教練:管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具,助您管理倦怠感並提升精神能量。透過實際使用心得,比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具
xix.ai
聊天機器人 最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係
最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人,助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較,以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶,並開始建立這段關係吧。

10 個工具
xix.ai
教育與學習 最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程
最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程

探索2026年最優秀的人工智慧資料科學導師,幫助他們掌握SQL、Pandas以及機器學習工作流程。在XIX.AI上檢視我們精心挑選的頂級導師名單,獲得強大而具有變革性的指導。透過對比免費和付費選項,並結合實際應用案例進行了解,今天就開啟你的資料科學精通之路吧。

10 個工具
xix.ai
聊天機器人 最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信
最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信

在 XIX.AI 探索 2026 年最頂尖的 AI 調情與對話訓練工具。我們精心挑選、評價最高的精選清單,能助您即時建立社交魅力與自信。探索這些必試且能徹底改變遊戲規則的工具,並透過免費與付費版本的比較,以及每週更新的排行榜,立即解鎖您的社交優勢。

10 個工具
xix.ai
評論 (31)
0/500
WillieJones
WillieJones 2025-12-22 18:30:38

これは…ひどいね。トレーニング速度を100倍にするなんて夢のような話だと思ったが、結局は誇大広告なのか。投資家へのプレゼンには十分かもしれないが、技術者はみんな疑ってかかるはずだ。実用化できなければ単なるバズワードに終わるよ。早く実証結果が欲しいな😅

RaymondGreen
RaymondGreen 2025-12-04 14:30:39

100倍速くなるって、さすが壮大なパフォーマンスですね 🤔 もう少し具体的なデータが知りたい。技術革新は必要だけど、過剰な期待を煽るのは業界全体に悪影響かも。結局普通のユーザーには手が届かない高級技術?

StevenAllen
StevenAllen 2025-09-12 10:30:38

진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...

ArthurJackson
ArthurJackson 2025-09-07 08:30:39

Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦‍♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?

PaulMartínez
PaulMartínez 2025-08-19 05:01:05

Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!

WillWalker
WillWalker 2025-08-06 11:00:59

What a letdown! Sakana AI's big claim about 100x faster training sounded amazing, but it’s just hype? Gotta admit, I was excited for a sec, but now I’m just skeptical about these bold AI promises. 🥳😑

OR