AI生成的紙張通過同行評審,Sakana聲稱,但細節是細微的
日本AI新創公司Sakana最近聲稱其AI系統「AI Scientist-v2」生成了一篇最早的經同行評審的科學出版物,引起熱議。然而,在過於興奮之前,有一些重要細節需要考慮。
關於AI在科學中角色的爭論正日益升溫。一些研究人員認為AI尚未準備好成為「共同科學家」,而其他人則看到潛力,但承認我們仍處於早期階段。Sakana屬於後者。
該公司使用AI Scientist-v2創建了一篇論文,提交給ICLR(一個備受推崇的AI會議)的工作坊。Sakana與不列顛哥倫比亞大學和牛津大學合作,向該工作坊提交了三篇AI生成的論文。AI處理了從假設到實驗、程式碼、數據分析、可視化,甚至標題的所有內容。
「我們通過向AI提供工作坊摘要和描述來生成研究想法,」Sakana的研究科學家兼創始成員Robert Lange通過電子郵件告訴TechCrunch。「這確保了生成的論文符合主題且適合提交。」
三篇論文中有一篇被ICLR工作坊接受,該論文聚焦於批評AI模型的訓練技術。然而,Sakana在論文出版前撤回了它,理由是為了透明度和尊重ICLR的慣例。

Sakana AI生成論文的片段 圖片來源:Sakana 「這篇被接受的論文既介紹了一種新的、有前景的神經網絡訓練方法,也顯示出仍存在的實證挑戰,」Lange說。「它提供了一個有趣的數據點,激發進一步的科學探究。」但我們暫時不要過於激動。Sakana在他們的部落格文章中承認,其AI在引文方面犯了一些「尷尬的」錯誤,例如將某方法歸因於2016年的論文,而不是原始的1997年作品。
此外,這篇論文未經受與其他同行評審出版物同等的審查。它在初步同行評審後被撤回,因此未接受工作坊組織者的「元評審」,後者可能會拒絕它。
另一件需要注意的事情是,會議工作坊的接受率通常高於主要會議軌。Sakana在部落格文章中提到這一點,並指出其AI生成的研究均未達到ICLR會議軌的內部標準。
AI研究人員兼阿爾伯塔大學助理教授Matthew Guzdial稱Sakana的結果「有些誤導」。
「Sakana的團隊從若干生成的論文中挑選了一些,這意味著他們使用了人類判斷來選擇他們認為可能被接受的輸出,」他通過電子郵件說。「我認為這表明人類加上AI可以很有效,而不是AI單獨就能創造科學進展。」
倫敦國王學院專攻AI的研究員Mike Cook質疑了同行評審者和工作坊的嚴謹性。
「像這樣的新工作坊通常由較年輕的研究人員審查,」他告訴TechCrunch。「還值得注意的是,這個工作坊聚焦於負面結果和困難——這很好,我之前也主持過類似的工作坊——但讓AI寫出令人信服的失敗內容可以說相對容易。」
Cook對AI通過同行評審並不感到驚訝,因為AI擅長撰寫聽起來像人類的文字。他指出,部分由AI生成的論文通過期刊審查並不新鮮,這為科學界提出了倫理問題。
AI的技術問題,如其「幻覺」傾向,使許多科學家對其用於嚴肅工作持謹慎態度。還有人擔心AI可能只是為科學文獻增添噪音,而不是推進知識。
「我們需要問自己,[Sakana的]結果是關於AI在設計和執行實驗方面的能力,還是關於它在向人類推銷想法方面的能力——我們知道AI在這方面已經很出色,」Cook說。「通過同行評審與為某領域貢獻知識是有區別的。」
值得讚揚的是,Sakana並未聲稱其AI能產生突破性或特別新穎的科學工作。他們的目標是「研究AI生成研究的質量」並強調「關於AI生成科學的規範」需求。
「關於[AI生成的]科學是否應首先基於其自身價值進行評判,以避免對其的偏見,這是一個困難的問題,」該公司寫道。「未來,我們將繼續與研究社群交換意見,討論這項技術的現狀,以確保它不會在未來發展成僅以通過同行評審為唯一目的的情況,從而嚴重損害科學同行評審過程的意義。」
相關文章
Meta增強AI安全以先進Llama工具
Meta已發布全新Llama安全工具,以強化AI開發並防範新興威脅。這些升級的Llama AI模型安全工具與Meta的新資源搭配,旨在賦能網路安全團隊利用AI進行防禦,提升所有AI利益相關者的安全性。使用Llama模型的開發者現可直接在Meta的Llama Protections頁面、Hugging Face及GitHub上獲得增強工具。Llama Guard 4引入多模態功能,支持文字與圖像的安
NotebookLM推出頂尖出版物與專家精選筆記本
Google正在增強其AI驅動的研究與筆記工具NotebookLM,使其成為一個全面的知識中心。週一,該公司推出了一個由知名作者、出版物、研究人員和非營利組織提供的精選筆記本集合,讓使用者能夠探索健康、旅遊、財經等多樣化主題。首批內容包括來自《經濟學人》、《大西洋月刊》、知名教授、作者,甚至莎士比亞作品的貢獻,展示NotebookLM在深入主題探索中的實際應用。Google解釋說,使用者可以存取原
阿里巴巴推出Wan2.1-VACE:開源AI視頻解決方案
阿里巴巴推出了Wan2.1-VACE,一款開源AI模型,旨在改變視頻創作與編輯流程。VACE是阿里巴巴Wan2.1視頻AI模型系列的關鍵組成部分,公司宣稱這是「業界首個為多樣化視頻生成與編輯任務提供全面解決方案的開源模型」。如果阿里巴巴能夠簡化視頻製作流程,將多種工具整合到單一平台,可能會重新定義行業標準。VACE能做什麼?它可以從多種輸入生成視頻,例如文字提示、靜態圖像或短視頻片段。除了視頻創作
評論 (36)
0/200
StevenGonzalez
2025-07-23 12:59:29
This is wild! An AI writing a peer-reviewed paper? Sakana’s claim is bold, but I’m curious how much human tweaking was involved. Still, it’s kinda thrilling to see AI push boundaries in science! 🚀
0
AlbertThomas
2025-04-22 21:28:17
O AI-Generated Paper Passes Peer Review parece incrível, mas os detalhes são um pouco decepcionantes. É como esperar um banquete e receber um lanche. Ainda assim, é um avanço para a IA na ciência, não é? Talvez da próxima vez eles nos surpreendam de verdade! 🚀
0
NicholasDavis
2025-04-22 10:29:30
AI生成的論文通過同行評審?這很酷,但細節有點模糊。Sakana的AI Scientist-v2聽起來很有前景,但我們需要更多透明度。儘管如此,這是AI在科學領域的一個進步!📖
0
BillyGreen
2025-04-22 08:06:42
AI-generated paper passing peer review? That's cool, but the details are a bit sketchy. Sakana's AI Scientist-v2 sounds promising, but we need more transparency. Still, it's a step forward for AI in science! 🤓
0
MatthewHill
2025-04-19 20:20:22
The AI Scientist-v2 sounds cool, but the details are a bit sketchy. It's exciting to think AI can write scientific papers, but we need more transparency. Still, it's a step forward in AI research! 🤔
0
TerryPerez
2025-04-19 13:56:38
AI-Generated Paper Passes Peer Review बहुत अच्छा लगता है, लेकिन विवरण थोड़ा निराशाजनक है। यह ऐसा है जैसे गौरमेट भोजन की उम्मीद करना और सैंडविच मिलना। फिर भी, विज्ञान में AI के लिए यह एक कदम आगे है, है ना? शायद अगली बार वे हमें वाकई हैरान कर देंगे! 🚀
0
日本AI新創公司Sakana最近聲稱其AI系統「AI Scientist-v2」生成了一篇最早的經同行評審的科學出版物,引起熱議。然而,在過於興奮之前,有一些重要細節需要考慮。
關於AI在科學中角色的爭論正日益升溫。一些研究人員認為AI尚未準備好成為「共同科學家」,而其他人則看到潛力,但承認我們仍處於早期階段。Sakana屬於後者。
該公司使用AI Scientist-v2創建了一篇論文,提交給ICLR(一個備受推崇的AI會議)的工作坊。Sakana與不列顛哥倫比亞大學和牛津大學合作,向該工作坊提交了三篇AI生成的論文。AI處理了從假設到實驗、程式碼、數據分析、可視化,甚至標題的所有內容。
「我們通過向AI提供工作坊摘要和描述來生成研究想法,」Sakana的研究科學家兼創始成員Robert Lange通過電子郵件告訴TechCrunch。「這確保了生成的論文符合主題且適合提交。」
三篇論文中有一篇被ICLR工作坊接受,該論文聚焦於批評AI模型的訓練技術。然而,Sakana在論文出版前撤回了它,理由是為了透明度和尊重ICLR的慣例。
但我們暫時不要過於激動。Sakana在他們的部落格文章中承認,其AI在引文方面犯了一些「尷尬的」錯誤,例如將某方法歸因於2016年的論文,而不是原始的1997年作品。
此外,這篇論文未經受與其他同行評審出版物同等的審查。它在初步同行評審後被撤回,因此未接受工作坊組織者的「元評審」,後者可能會拒絕它。
另一件需要注意的事情是,會議工作坊的接受率通常高於主要會議軌。Sakana在部落格文章中提到這一點,並指出其AI生成的研究均未達到ICLR會議軌的內部標準。
AI研究人員兼阿爾伯塔大學助理教授Matthew Guzdial稱Sakana的結果「有些誤導」。
「Sakana的團隊從若干生成的論文中挑選了一些,這意味著他們使用了人類判斷來選擇他們認為可能被接受的輸出,」他通過電子郵件說。「我認為這表明人類加上AI可以很有效,而不是AI單獨就能創造科學進展。」
倫敦國王學院專攻AI的研究員Mike Cook質疑了同行評審者和工作坊的嚴謹性。
「像這樣的新工作坊通常由較年輕的研究人員審查,」他告訴TechCrunch。「還值得注意的是,這個工作坊聚焦於負面結果和困難——這很好,我之前也主持過類似的工作坊——但讓AI寫出令人信服的失敗內容可以說相對容易。」
Cook對AI通過同行評審並不感到驚訝,因為AI擅長撰寫聽起來像人類的文字。他指出,部分由AI生成的論文通過期刊審查並不新鮮,這為科學界提出了倫理問題。
AI的技術問題,如其「幻覺」傾向,使許多科學家對其用於嚴肅工作持謹慎態度。還有人擔心AI可能只是為科學文獻增添噪音,而不是推進知識。
「我們需要問自己,[Sakana的]結果是關於AI在設計和執行實驗方面的能力,還是關於它在向人類推銷想法方面的能力——我們知道AI在這方面已經很出色,」Cook說。「通過同行評審與為某領域貢獻知識是有區別的。」
值得讚揚的是,Sakana並未聲稱其AI能產生突破性或特別新穎的科學工作。他們的目標是「研究AI生成研究的質量」並強調「關於AI生成科學的規範」需求。
「關於[AI生成的]科學是否應首先基於其自身價值進行評判,以避免對其的偏見,這是一個困難的問題,」該公司寫道。「未來,我們將繼續與研究社群交換意見,討論這項技術的現狀,以確保它不會在未來發展成僅以通過同行評審為唯一目的的情況,從而嚴重損害科學同行評審過程的意義。」


This is wild! An AI writing a peer-reviewed paper? Sakana’s claim is bold, but I’m curious how much human tweaking was involved. Still, it’s kinda thrilling to see AI push boundaries in science! 🚀




O AI-Generated Paper Passes Peer Review parece incrível, mas os detalhes são um pouco decepcionantes. É como esperar um banquete e receber um lanche. Ainda assim, é um avanço para a IA na ciência, não é? Talvez da próxima vez eles nos surpreendam de verdade! 🚀




AI生成的論文通過同行評審?這很酷,但細節有點模糊。Sakana的AI Scientist-v2聽起來很有前景,但我們需要更多透明度。儘管如此,這是AI在科學領域的一個進步!📖




AI-generated paper passing peer review? That's cool, but the details are a bit sketchy. Sakana's AI Scientist-v2 sounds promising, but we need more transparency. Still, it's a step forward for AI in science! 🤓




The AI Scientist-v2 sounds cool, but the details are a bit sketchy. It's exciting to think AI can write scientific papers, but we need more transparency. Still, it's a step forward in AI research! 🤔




AI-Generated Paper Passes Peer Review बहुत अच्छा लगता है, लेकिन विवरण थोड़ा निराशाजनक है। यह ऐसा है जैसे गौरमेट भोजन की उम्मीद करना और सैंडविच मिलना। फिर भी, विज्ञान में AI के लिए यह एक कदम आगे है, है ना? शायद अगली बार वे हमें वाकई हैरान कर देंगे! 🚀












