AI生成的紙張通過同行評審,Sakana聲稱,但細節是細微的
日本AI新創公司Sakana最近聲稱其AI系統「AI Scientist-v2」生成了一篇最早的經同行評審的科學出版物,引起熱議。然而,在過於興奮之前,有一些重要細節需要考慮。
關於AI在科學中角色的爭論正日益升溫。一些研究人員認為AI尚未準備好成為「共同科學家」,而其他人則看到潛力,但承認我們仍處於早期階段。Sakana屬於後者。
該公司使用AI Scientist-v2創建了一篇論文,提交給ICLR(一個備受推崇的AI會議)的工作坊。Sakana與不列顛哥倫比亞大學和牛津大學合作,向該工作坊提交了三篇AI生成的論文。AI處理了從假設到實驗、程式碼、數據分析、可視化,甚至標題的所有內容。
「我們通過向AI提供工作坊摘要和描述來生成研究想法,」Sakana的研究科學家兼創始成員Robert Lange通過電子郵件告訴TechCrunch。「這確保了生成的論文符合主題且適合提交。」
三篇論文中有一篇被ICLR工作坊接受,該論文聚焦於批評AI模型的訓練技術。然而,Sakana在論文出版前撤回了它,理由是為了透明度和尊重ICLR的慣例。

Sakana AI生成論文的片段 圖片來源:Sakana 「這篇被接受的論文既介紹了一種新的、有前景的神經網絡訓練方法,也顯示出仍存在的實證挑戰,」Lange說。「它提供了一個有趣的數據點,激發進一步的科學探究。」但我們暫時不要過於激動。Sakana在他們的部落格文章中承認,其AI在引文方面犯了一些「尷尬的」錯誤,例如將某方法歸因於2016年的論文,而不是原始的1997年作品。
此外,這篇論文未經受與其他同行評審出版物同等的審查。它在初步同行評審後被撤回,因此未接受工作坊組織者的「元評審」,後者可能會拒絕它。
另一件需要注意的事情是,會議工作坊的接受率通常高於主要會議軌。Sakana在部落格文章中提到這一點,並指出其AI生成的研究均未達到ICLR會議軌的內部標準。
AI研究人員兼阿爾伯塔大學助理教授Matthew Guzdial稱Sakana的結果「有些誤導」。
「Sakana的團隊從若干生成的論文中挑選了一些,這意味著他們使用了人類判斷來選擇他們認為可能被接受的輸出,」他通過電子郵件說。「我認為這表明人類加上AI可以很有效,而不是AI單獨就能創造科學進展。」
倫敦國王學院專攻AI的研究員Mike Cook質疑了同行評審者和工作坊的嚴謹性。
「像這樣的新工作坊通常由較年輕的研究人員審查,」他告訴TechCrunch。「還值得注意的是,這個工作坊聚焦於負面結果和困難——這很好,我之前也主持過類似的工作坊——但讓AI寫出令人信服的失敗內容可以說相對容易。」
Cook對AI通過同行評審並不感到驚訝,因為AI擅長撰寫聽起來像人類的文字。他指出,部分由AI生成的論文通過期刊審查並不新鮮,這為科學界提出了倫理問題。
AI的技術問題,如其「幻覺」傾向,使許多科學家對其用於嚴肅工作持謹慎態度。還有人擔心AI可能只是為科學文獻增添噪音,而不是推進知識。
「我們需要問自己,[Sakana的]結果是關於AI在設計和執行實驗方面的能力,還是關於它在向人類推銷想法方面的能力——我們知道AI在這方面已經很出色,」Cook說。「通過同行評審與為某領域貢獻知識是有區別的。」
值得讚揚的是,Sakana並未聲稱其AI能產生突破性或特別新穎的科學工作。他們的目標是「研究AI生成研究的質量」並強調「關於AI生成科學的規範」需求。
「關於[AI生成的]科學是否應首先基於其自身價值進行評判,以避免對其的偏見,這是一個困難的問題,」該公司寫道。「未來,我們將繼續與研究社群交換意見,討論這項技術的現狀,以確保它不會在未來發展成僅以通過同行評審為唯一目的的情況,從而嚴重損害科學同行評審過程的意義。」
相關文章
Midjourney 為創意內容推出最先進的 AI 視訊產生器
Midjourney 的 AI 視訊產生突破Midjourney 推出了其首款 AI 視訊製作工具,標誌著在其著名的圖像製作能力之外的重大擴展。最初的版本可讓使用者將上傳的圖片和平台產生的作品轉換成簡短的 5 秒動畫片段,並有雄心勃勃的未來強化計劃。核心特色與功能直覺式「動畫」按鈕,可將靜態影像轉換成動態影像從文字提示產生 5 秒基本影片透過手動編輯提示自訂動態控制視訊延伸功能(總運行時間最長 2
川普將人工智慧的成長優先於管制,爭取超越中國
川普政府於週三公佈了具有里程碑意義的「人工智慧行動計畫」,標誌著與拜登政府迴避風險的人工智慧政策的決裂。這份雄心勃勃的藍圖將積極發展基礎設施、全面放寬監管、加強國家安全措施以及與中國在人工智能領域的戰略競爭放在首位。政策的轉變可能會對經濟和社會產生廣泛的影響,特別是在能源使用和環境法規方面。政府建議擴大資料中心建設,包括在聯邦土地上,同時可能放寬能源需求高峰期的環境保護,這些決定可能會影響產業和消
YouTube 將 Veo 3 AI 視訊工具直接整合至短片平台
YouTube Shorts 今年夏天將採用 Veo 3 AI 視訊模型YouTube 執行長 Neal Mohan 在坎城獅子獎主題演講中透露,該平台最尖端的 Veo 3 AI 影片生成技術將於今年夏天稍後在 YouTube Shorts 上亮相。在此之前,Allison Johnson 曾發表評論,將 Veo 3 描述為 AI 輔助內容創作的革命。目前,Shorts 製作人員透過 Dream
評論 (38)
0/200
EdwardRamirez
2025-08-27 05:01:20
Mind-blowing that an AI-generated paper passed peer review! 🤯 But I’m curious, how much human tweaking was involved? Sakana’s claim is bold, but the nuances make me wonder if it’s more hype than revolution. Still, AI in science is wild!
0
RogerGonzalez
2025-08-15 10:01:03
Mind-blowing that AI can churn out a peer-reviewed paper! But I’m curious—how much human tweaking was needed to get it there? 🤔
0
StevenGonzalez
2025-07-23 12:59:29
This is wild! An AI writing a peer-reviewed paper? Sakana’s claim is bold, but I’m curious how much human tweaking was involved. Still, it’s kinda thrilling to see AI push boundaries in science! 🚀
0
AlbertThomas
2025-04-22 21:28:17
O AI-Generated Paper Passes Peer Review parece incrível, mas os detalhes são um pouco decepcionantes. É como esperar um banquete e receber um lanche. Ainda assim, é um avanço para a IA na ciência, não é? Talvez da próxima vez eles nos surpreendam de verdade! 🚀
0
NicholasDavis
2025-04-22 10:29:30
AI生成的論文通過同行評審?這很酷,但細節有點模糊。Sakana的AI Scientist-v2聽起來很有前景,但我們需要更多透明度。儘管如此,這是AI在科學領域的一個進步!📖
0
BillyGreen
2025-04-22 08:06:42
AI-generated paper passing peer review? That's cool, but the details are a bit sketchy. Sakana's AI Scientist-v2 sounds promising, but we need more transparency. Still, it's a step forward for AI in science! 🤓
0
日本AI新創公司Sakana最近聲稱其AI系統「AI Scientist-v2」生成了一篇最早的經同行評審的科學出版物,引起熱議。然而,在過於興奮之前,有一些重要細節需要考慮。
關於AI在科學中角色的爭論正日益升溫。一些研究人員認為AI尚未準備好成為「共同科學家」,而其他人則看到潛力,但承認我們仍處於早期階段。Sakana屬於後者。
該公司使用AI Scientist-v2創建了一篇論文,提交給ICLR(一個備受推崇的AI會議)的工作坊。Sakana與不列顛哥倫比亞大學和牛津大學合作,向該工作坊提交了三篇AI生成的論文。AI處理了從假設到實驗、程式碼、數據分析、可視化,甚至標題的所有內容。
「我們通過向AI提供工作坊摘要和描述來生成研究想法,」Sakana的研究科學家兼創始成員Robert Lange通過電子郵件告訴TechCrunch。「這確保了生成的論文符合主題且適合提交。」
三篇論文中有一篇被ICLR工作坊接受,該論文聚焦於批評AI模型的訓練技術。然而,Sakana在論文出版前撤回了它,理由是為了透明度和尊重ICLR的慣例。
但我們暫時不要過於激動。Sakana在他們的部落格文章中承認,其AI在引文方面犯了一些「尷尬的」錯誤,例如將某方法歸因於2016年的論文,而不是原始的1997年作品。
此外,這篇論文未經受與其他同行評審出版物同等的審查。它在初步同行評審後被撤回,因此未接受工作坊組織者的「元評審」,後者可能會拒絕它。
另一件需要注意的事情是,會議工作坊的接受率通常高於主要會議軌。Sakana在部落格文章中提到這一點,並指出其AI生成的研究均未達到ICLR會議軌的內部標準。
AI研究人員兼阿爾伯塔大學助理教授Matthew Guzdial稱Sakana的結果「有些誤導」。
「Sakana的團隊從若干生成的論文中挑選了一些,這意味著他們使用了人類判斷來選擇他們認為可能被接受的輸出,」他通過電子郵件說。「我認為這表明人類加上AI可以很有效,而不是AI單獨就能創造科學進展。」
倫敦國王學院專攻AI的研究員Mike Cook質疑了同行評審者和工作坊的嚴謹性。
「像這樣的新工作坊通常由較年輕的研究人員審查,」他告訴TechCrunch。「還值得注意的是,這個工作坊聚焦於負面結果和困難——這很好,我之前也主持過類似的工作坊——但讓AI寫出令人信服的失敗內容可以說相對容易。」
Cook對AI通過同行評審並不感到驚訝,因為AI擅長撰寫聽起來像人類的文字。他指出,部分由AI生成的論文通過期刊審查並不新鮮,這為科學界提出了倫理問題。
AI的技術問題,如其「幻覺」傾向,使許多科學家對其用於嚴肅工作持謹慎態度。還有人擔心AI可能只是為科學文獻增添噪音,而不是推進知識。
「我們需要問自己,[Sakana的]結果是關於AI在設計和執行實驗方面的能力,還是關於它在向人類推銷想法方面的能力——我們知道AI在這方面已經很出色,」Cook說。「通過同行評審與為某領域貢獻知識是有區別的。」
值得讚揚的是,Sakana並未聲稱其AI能產生突破性或特別新穎的科學工作。他們的目標是「研究AI生成研究的質量」並強調「關於AI生成科學的規範」需求。
「關於[AI生成的]科學是否應首先基於其自身價值進行評判,以避免對其的偏見,這是一個困難的問題,」該公司寫道。「未來,我們將繼續與研究社群交換意見,討論這項技術的現狀,以確保它不會在未來發展成僅以通過同行評審為唯一目的的情況,從而嚴重損害科學同行評審過程的意義。」




Mind-blowing that an AI-generated paper passed peer review! 🤯 But I’m curious, how much human tweaking was involved? Sakana’s claim is bold, but the nuances make me wonder if it’s more hype than revolution. Still, AI in science is wild!




Mind-blowing that AI can churn out a peer-reviewed paper! But I’m curious—how much human tweaking was needed to get it there? 🤔




This is wild! An AI writing a peer-reviewed paper? Sakana’s claim is bold, but I’m curious how much human tweaking was involved. Still, it’s kinda thrilling to see AI push boundaries in science! 🚀




O AI-Generated Paper Passes Peer Review parece incrível, mas os detalhes são um pouco decepcionantes. É como esperar um banquete e receber um lanche. Ainda assim, é um avanço para a IA na ciência, não é? Talvez da próxima vez eles nos surpreendam de verdade! 🚀




AI生成的論文通過同行評審?這很酷,但細節有點模糊。Sakana的AI Scientist-v2聽起來很有前景,但我們需要更多透明度。儘管如此,這是AI在科學領域的一個進步!📖




AI-generated paper passing peer review? That's cool, but the details are a bit sketchy. Sakana's AI Scientist-v2 sounds promising, but we need more transparency. Still, it's a step forward for AI in science! 🤓












