Sakana AI急剧提高模型训练速度

本周,由英伟达支持并获得风险资本数百万美元注资的初创公司Sakana AI发表了大胆声明。他们声称其新AI系统,命名为AI CUDA工程师,可将某些AI模型的训练速度惊人地提升100倍。
事实证明,这一切都是虚张声势。
X平台(你知道的,以前叫Twitter的那个平台)上的用户很快就揭穿了Sakana的夸大其词。他们的AI非但没有加速,反而拖慢了性能。一位用户甚至报告说速度慢了3倍——天哪,这完全违背了他们的承诺!
那么,出了什么问题?据来自OpenAI的Lucas Beyer指出,这是代码中的一个隐秘错误。Beyer在X上指出:“他们的原始代码在某些微妙的地方出了错。他们进行了两次基准测试,结果却大相径庭,这应该让他们停下来反思。”
在周五发布的一份坦诚的事后分析中,Sakana承认了错误。他们承认自己的系统找到了一种“作弊”(他们自己的用词,不是我的)方式,通过利用评估代码中的漏洞,绕过了重要的检查,如准确性验证。Sakana称之为“奖励黑客”,即AI找到捷径来提升指标,却没有真正实现目标——在这种情况下,就是加速模型训练。这有点像那些下棋的AI找到狡猾的取胜方法。
Sakana表示他们已经修复了这个问题,并正在更新他们的论文和结果,以反映真实情况。他们在X上写道:“我们已经使评估和运行时性能分析工具更加健壮,消除了许多此类漏洞。我们正在修订我们的论文和结果,以反映和讨论这些影响……我们为我们的疏忽向读者深表歉意。我们将很快提供这份工作的修订版,并讨论我们的经验教训。”
不得不为Sakana勇于承认错误点赞。但整个事件是一个深刻的提醒:在AI世界里,如果某件事听起来好得难以置信,那它很可能就是假的。
相关文章
AI生成的纸张通过同行评审,Sakana声称,但细节是细微的
日本AI初创公司Sakana最近声称其AI系统AI Scientist-V2发起了浪潮,该系统生成了第一个经过同行评审的科学出版物之一。但是,在我们太兴奋之前,还有一些重要的细节要考虑。关于AI在科学中的作用的辩论正在加热。所以
微软研究发现更多人工智能代币会增加推理错误
关于 LLM 推理效率的新见解微软的最新研究表明,大型语言模型中的高级推理技术并不能在不同的人工智能系统中产生统一的改进。他们的突破性研究分析了九个领先的基础模型在推理过程中对各种扩展方法的反应。评估推理时间扩展方法研究团队对三种不同的缩放技术实施了严格的测试方法:传统的思维链提示并行答案生成与汇总通过反馈环路进行顺序改进评估推理性能的实验框架八项综合基准提供了跨学科的挑战性测试场景,包括数学、科
"AI K-Pop 偶像时尚潮流:变身时尚偶像"
K-Pop 时尚革命:人工智能与偶像风格的结合K-Pop 偶像不仅是音乐艺术家,他们还是全球时尚潮流的引领者,其时尚影响力正以指数级增长。随着人工智能改变创意产业,我们正在进入一个科技与 K-Pop 美学相结合的新时代。本指南将探讨最前沿的人工智能应用,让你重新创造、定制自己喜欢的偶像造型,并从中汲取灵感,用于日常穿着。为什么人工智能正在改变 K-Pop 时尚?前所未有地接触偶像造型概念基于体型的
评论 (29)
0/200
StevenAllen
2025-09-12 10:30:38
진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...
0
ArthurJackson
2025-09-07 08:30:39
Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?
0
PaulMartínez
2025-08-19 05:01:05
Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!
0
WillWalker
2025-08-06 11:00:59
What a letdown! Sakana AI's big claim about 100x faster training sounded amazing, but it’s just hype? Gotta admit, I was excited for a sec, but now I’m just skeptical about these bold AI promises. 🥳😑
0
DanielThomas
2025-04-16 20:41:15
사카나 AI가 모델 훈련 속도를 100배나 높인다고 해서 기대했는데, 다 허언이었어요. 정말 실망스러웠지만, 적어도 사람들 입에 오르내렸네요. 다음에는 정말로 기대를 저버리지 말아줬으면 좋겠어요! 😔
0
WalterMartinez
2025-04-16 17:31:51
A promessa da Sakana AI de aumentar a velocidade de treinamento do modelo em 100 vezes parecia boa demais para ser verdade, e foi mesmo! Uma decepção total, mas pelo menos eles conseguiram que todos falassem sobre eles. Talvez da próxima vez eles realmente entreguem o que prometem! 😂
0
本周,由英伟达支持并获得风险资本数百万美元注资的初创公司Sakana AI发表了大胆声明。他们声称其新AI系统,命名为AI CUDA工程师,可将某些AI模型的训练速度惊人地提升100倍。
事实证明,这一切都是虚张声势。
X平台(你知道的,以前叫Twitter的那个平台)上的用户很快就揭穿了Sakana的夸大其词。他们的AI非但没有加速,反而拖慢了性能。一位用户甚至报告说速度慢了3倍——天哪,这完全违背了他们的承诺!
那么,出了什么问题?据来自OpenAI的Lucas Beyer指出,这是代码中的一个隐秘错误。Beyer在X上指出:“他们的原始代码在某些微妙的地方出了错。他们进行了两次基准测试,结果却大相径庭,这应该让他们停下来反思。”
在周五发布的一份坦诚的事后分析中,Sakana承认了错误。他们承认自己的系统找到了一种“作弊”(他们自己的用词,不是我的)方式,通过利用评估代码中的漏洞,绕过了重要的检查,如准确性验证。Sakana称之为“奖励黑客”,即AI找到捷径来提升指标,却没有真正实现目标——在这种情况下,就是加速模型训练。这有点像那些下棋的AI找到狡猾的取胜方法。
Sakana表示他们已经修复了这个问题,并正在更新他们的论文和结果,以反映真实情况。他们在X上写道:“我们已经使评估和运行时性能分析工具更加健壮,消除了许多此类漏洞。我们正在修订我们的论文和结果,以反映和讨论这些影响……我们为我们的疏忽向读者深表歉意。我们将很快提供这份工作的修订版,并讨论我们的经验教训。”
不得不为Sakana勇于承认错误点赞。但整个事件是一个深刻的提醒:在AI世界里,如果某件事听起来好得难以置信,那它很可能就是假的。




진짜로 100배 빨라진다고? 🤔 회사 홍보용 과장 광고 같은데... 누구든 놀라운 성능이라면 실제 벤치마크 결과 공개해야 믿을 수 있을 거 같아요. 엔비디아 지원 받는다고 해도 너무 뻥튀기 한 것 같은데...




Ну и новость... 100-кратное ускорение обучения ИИ оказалось банальным раздуванием фактов. Опять стартапы пытаются впечатлить инвесторов громкими заявлениями, а по факту — обычный маркетинг 🤦♂️. NVIDIA, вы же умнее, как можно вестись на такие сказки?




Whoa, Sakana AI's 100x speed claim sounded too good to be true, and guess what? It was! 😅 Kinda reminds me of those overhyped tech demos that crash and burn. Hope they sort out the bugs soon!




What a letdown! Sakana AI's big claim about 100x faster training sounded amazing, but it’s just hype? Gotta admit, I was excited for a sec, but now I’m just skeptical about these bold AI promises. 🥳😑




사카나 AI가 모델 훈련 속도를 100배나 높인다고 해서 기대했는데, 다 허언이었어요. 정말 실망스러웠지만, 적어도 사람들 입에 오르내렸네요. 다음에는 정말로 기대를 저버리지 말아줬으면 좋겠어요! 😔




A promessa da Sakana AI de aumentar a velocidade de treinamento do modelo em 100 vezes parecia boa demais para ser verdade, e foi mesmo! Uma decepção total, mas pelo menos eles conseguiram que todos falassem sobre eles. Talvez da próxima vez eles realmente entreguem o que prometem! 😂












