選項
首頁
新聞
專家說,AI還沒有準備好作為“共同科學家”

專家說,AI還沒有準備好作為“共同科學家”

2025-04-10
189

專家說,AI還沒有準備好作為“共同科學家”

Google 最近推出了其「AI 共同科學家」,這是一款旨在幫助科學家生成假設和研究計劃的 AI 工具。該公司宣稱這是發現新知識的革命性改變,但專家對其實際影響持懷疑態度。

「這個初步工具雖然有趣,但似乎不太可能被認真使用,」麻省理工學院的電腦視覺研究員 Sara Beery 在接受 TechCrunch 採訪時表示。「我不確定科學界對這類假設生成系統有需求。」

Google 是最新一家宣稱 AI 將徹底改變科學研究的科技巨頭,特別是在生物醫學等數據密集領域。OpenAI 執行長 Sam Altman 在今年早些時候的一篇論文中寫道,「超智能」AI 可以「大幅加速科學發現和創新」。同樣,Anthropic 執行長 Dario Amodei 預測 AI 可以幫助開發大多數癌症的治療方法。

然而,許多研究人員認為當前的 AI 工具遠未達到這些雄心勃勃的說法。他們認為,像 Google 的 AI 共同科學家這樣的應用更多是炒作而非實質,缺乏支持其承諾的實證數據。

例如,Google 在其 AI 共同科學家的博客文章中誇耀其在急性髓系白血病(一種影響骨髓的血癌)藥物再利用方面的潛力。然而,亞利桑那州西北醫療中心-圖森的病理學家 Favia Dubyk 表示,結果過於模糊,「沒有哪位正統科學家會認真對待它們。」

「它可能是一個不錯的起點,但缺乏細節令人擔憂,讓我無法信任它,」Dubyk 對 TechCrunch 說。「提供的資訊不足,實在很難判斷這是否真正有用。」

這不是 Google 第一次因宣傳 AI 突破而未提供足夠細節以供他人重現結果,從而遭到科學界的批評。

早在 2020 年,Google 聲稱其訓練用於檢測乳腺腫瘤的 AI 系統表現超越人類放射科醫師。但哈佛和史丹佛的研究人員在《Nature》期刊發表反駁,指出 Google 研究中缺乏詳細方法和程式碼「損害了其科學價值」。

科學家們還批評 Google 在材料工程等領域淡化其 AI 工具的局限性。2023 年,該公司聲稱在其 AI 系統 GNoME 的幫助下合成了大約 40 種「新材料」。然而,獨立分析發現這些材料中沒有一種是真正的新材料。

「在 Google 的『共同科學家』等工具經過跨多學科的嚴格獨立評估之前,我們無法真正了解其優勢和局限性,」羅徹斯特理工學院軟體工程助理教授 Ashique KhudaBukhsh 在接受 TechCrunch 採訪時表示。「AI 在受控環境中表現良好,但在應用於大規模時可能會失敗。」

複雜的過程

開發用於輔助科學發現的 AI 工具很棘手,因為很難預測所有可能出錯的因素。AI 在篩選大量可能性時很有用,但它是否能處理導致重大突破的創意問題解決尚不清楚。

「歷史上一些最重要的科學進展,如 mRNA 疫苗的開發,都是由人類的直覺和在懷疑面前的堅持推動的,」KhudaBukhsh 說。「當前的 AI 可能不適合複製這種能力。」

日本索尼電腦科學實驗室的 AI 研究員 Lana Sinapayen 認為,像 Google 的 AI 共同科學家這樣的工具專注於科學工作的錯誤面向。

Sinapayen 認為,AI 在自動化繁瑣任務(如總結新學術文獻或格式化補助申請)方面有價值。但她認為,生成假設的 AI 共同科學家需求不大,因為許多研究人員認為這項任務具有智力上的滿足感。

「對許多科學家,包括我在內,生成假設是工作中最有趣的部分,」Sinapayen 對 TechCrunch 說。「我為什麼要把我的樂趣外包給電腦,然後只留下辛苦的工作自己做?總的來說,許多生成式 AI 研究人員似乎誤解了人類為什麼做他們所做的事情,結果我們得到的是自動化我們感到快樂部分的產品提案。」

Beery 指出,科學過程中設計和實施研究以測試假設通常是最困難的部分,而當前 AI 系統難以勝任這一點。AI 無法實際進行實驗,且在數據稀缺的問題上常常表現不佳。

「大多數科學無法完全在虛擬環境中進行——科學過程通常有重要的物理部分,如收集新數據和在實驗室進行實驗,」Beery 說。「像 Google 的 AI 共同科學家這樣的系統相對於實際科學過程的一大限制,是缺乏關於使用該系統的實驗室和研究者的背景資訊,包括他們的具體研究目標、過去的工作、技能組合以及可用的資源,這無疑限制了其可用性。」

AI 風險

AI 的技術局限性和風險,例如其「幻覺」或生成錯誤資訊的傾向,使科學家對依賴它進行嚴肅工作持謹慎態度。

KhudaBukhsh 擔心 AI 工具可能最終會讓科學文獻充斥噪音,而非促進進步。

這已經在發生。一項近期研究發現,AI 生成的「垃圾科學」正在充斥 Google Scholar,Google 的免費學術文獻搜尋引擎。

「如果不仔細監控,AI 生成的研究可能會以低質量甚至誤導性的研究淹沒科學領域,壓垮同行評審過程,」KhudaBukhsh 說。「在電腦科學等領域,頂級會議的投稿量呈指數增長,同行評審過程已經面臨挑戰。」

即使是設計良好的研究也可能因 AI 的錯誤行為而受到損害,Sinapayen 警告說。雖然她欣賞能協助文獻回顧和綜合的工具理念,但她不信任當前的 AI 能可靠地完成這項工作。

「這些是現有各種工具聲稱能做的事情,但這些不是我個人會交給當前 AI 去完成的任務,」Sinapayen 說。她還對 AI 系統的訓練方式和其消耗的能源表示擔憂。「即使所有倫理問題都解決了,當前的 AI 對我來說還不夠可靠,我無法依賴它們的輸出來進行我的工作。」

相關文章
Altara籌集了700萬美元,旨在透過資料解決方案加速物理科學研究的發展。 Altara籌集了700萬美元,旨在透過資料解決方案加速物理科學研究的發展。 開發電池、半導體和醫療裝置的公司會生成海量資料。然而,這些資訊往往分散在各種電子表格和過時的系統中,這使得人們很難利用這些資料來改進產品或分析故障原因。總部位於舊金山的初創企業Altara最近獲得了700萬美元的種子資金,他們開發了一種人工智慧技術,旨在打破這些資料孤島。這種技術能將零散的技術資訊整合到一個平臺上。此次融資由Greylock領投,Neo、BoxGroup、Liquid 2 Ventures和Jeff Dean也參與了投資。Altara是由Eva Tuecke(右圖)和Cath
前OpenAI與DeepMind科學家為AI驅動的科學自動化項目籌得創紀錄的3億美元種子輪融資 前OpenAI與DeepMind科學家為AI驅動的科學自動化項目籌得創紀錄的3億美元種子輪融資 週二,Periodic Labs正式結束隱身模式,宣布完成規模達3億美元的里程碑式種子輪融資。本輪融資獲得科技業界真正全明星陣容的支持,包括安德森·霍洛維茨基金、DST Global、英偉達、Accel創投、Elad Gil、Jeff Dean、Eric Schmidt及Jeff Bezos。該公司由埃金·多古斯·庫布克與利安·費杜斯共同創立。庫布克曾領導谷歌大腦與DeepMind的材料與化學團隊
以優化為驅動的人工智慧,正成為通用的模型發展新途徑 以優化為驅動的人工智慧,正成為通用的模型發展新途徑 伊利諾大學厄巴納-香檳分校與維吉尼亞大學的研究人員開發出一種新型模型架構,有望為具備更強推理能力且更具韌性的AI系統鋪平道路。名為「能量基變壓器」(EBT)的架構,能自然運用推論時間擴展性來解決複雜挑戰。對企業而言,這意味著能以成本效益方式部署人工智慧應用,無需專門調校模型即可適應新情境。系統二思維的挑戰在心理學中,人類認知通常分為兩種模式:快速直覺的系統一,以及較緩慢、更刻意且具分析性的系統二。
相關專題推薦
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
生產率 AI 個人健康與專注力教練:管理倦怠感並提升精神能量
AI 個人健康與專注力教練:管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具,助您管理倦怠感並提升精神能量。透過實際使用心得,比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具
xix.ai
聊天機器人 最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係
最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人,助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較,以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶,並開始建立這段關係吧。

10 個工具
xix.ai
教育與學習 最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程
最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程

探索2026年最優秀的人工智慧資料科學導師,幫助他們掌握SQL、Pandas以及機器學習工作流程。在XIX.AI上檢視我們精心挑選的頂級導師名單,獲得強大而具有變革性的指導。透過對比免費和付費選項,並結合實際應用案例進行了解,今天就開啟你的資料科學精通之路吧。

10 個工具
xix.ai
聊天機器人 最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信
最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信

在 XIX.AI 探索 2026 年最頂尖的 AI 調情與對話訓練工具。我們精心挑選、評價最高的精選清單,能助您即時建立社交魅力與自信。探索這些必試且能徹底改變遊戲規則的工具,並透過免費與付費版本的比較,以及每週更新的排行榜,立即解鎖您的社交優勢。

10 個工具
xix.ai
代碼 最適合自動化單元測試的最佳AI工具:一鍵生成Jest、PyTest和JUnit測試用例
最適合自動化單元測試的最佳AI工具:一鍵生成Jest、PyTest和JUnit測試用例

探索2026年最新評選出的頂級AI工具,這些工具專為自動化單元測試而設計。我們精心挑選了那些功能強大、能夠改變開發流程的工具,它們能夠幫助您快速生成Jest、PyTest和JUnit測試用例。在XIX.AI平臺上,您可以免費檢視各種選項,並透過實際測試結果以及每週更新的排名來了解它們的優劣。立即利用這些AI工具,提升您的開發效率吧!

10 個工具
xix.ai
評論 (36)
0/500
WyattHill
WyattHill 2025-11-14 02:30:35

Essa ideia da IA como 'co-pesquisadora' ainda me parece tão crua... A Google adora vender sonhos, mas será que em laboratórios reais isso vai funcionar mesmo? 🤔 Lembrei daqueles assistentes virtuais que prometiam revolucionar tudo e hoje mal entendem meu sotaque.

PatrickLewis
PatrickLewis 2025-08-24 17:01:17

I was hyped about Google's AI co-scientist, but experts raining on the parade makes sense. Sounds like it’s more flash than substance right now. 🤔 Still, curious to see where this goes!

GeorgeWilliams
GeorgeWilliams 2025-08-17 21:00:59

I was super excited about Google's AI co-scientist at first, but now I’m kinda bummed experts think it’s overhyped. 😕 Sounds like it’s more of a fancy assistant than a real game-changer. Anyone else feel it’s just not ready to shake up science yet?

PaulWilson
PaulWilson 2025-08-08 21:00:59

I read about Google's AI co-scientist, and it sounds like a cool idea, but experts seem to think it’s more hype than substance. Anyone else feel like AI’s being oversold these days? 🤔

GaryLewis
GaryLewis 2025-08-04 14:48:52

I read about Google's AI co-scientist and it sounds cool, but experts throwing shade makes me wonder if it’s just hype. 🤔 Anyone else think AI’s still got a long way to go before it’s truly helping scientists discover new stuff?

PeterYoung
PeterYoung 2025-07-23 12:59:47

I find it intriguing that Google's pushing this AI co-scientist angle, but I'm not shocked experts are skeptical. Sounds like a cool concept, yet overhyped tech often fizzles out in practice. Anyone else think it’s more marketing than science? 😏

OR