Google的AI共同科學家通過高級“測試時間縮放”技術增強了研究
在週三,Google宣布對其Gemini 2.0大型語言模型進行了一項令人振奮的更新,將其轉化為一個AI共同科學家,能夠在相較於傳統人類主導研究團隊顯著縮短的時間內,生成新穎的科學假設。這個創新的工具旨在協助科學家,通過與人類協作,作為有用的合作夥伴,加速發現過程。
Google宣稱這款AI共同科學家是AI輔助技術的重要進步,承諾將徹底改變科學研究的方式。該系統設計為「人在迴路中」,確保AI從文獻回顧到假設形成的操作,都受到人類輸入的指導。
在一個大膽的舉措中,Google的研究人員與倫敦帝國理工學院的一個團隊共同發表了一篇技術論文,探討細菌如何演化成新病原體的相同假設。AI共同科學家僅用兩天就生成了其假設,與人類研究者長達十年的努力形成鮮明對比。
假設生成機器
Google將AI共同科學家描述為一個「假設生成機器」,利用多個專業化代理。一旦科學家以自然語言輸入研究目標,系統便開始運作,生成假設、研究概述和實驗方案。涉及的代理包括生成、反思、排序、演化、接近度和元審查,這些代理協同工作,推動科學探究的邊界。



該系統不僅僅是回顧現有文獻;它旨在發現原創知識,並針對特定目標制定新穎的研究假設。
極致測試時擴展
將Gemini 2.0改進為AI共同科學家在很大程度上依賴於「測試時擴展」,這是一種技術,AI代理使用越來越多的計算能力來迭代精煉其輸出。這種方法已在其他推理模型如OpenAI的o1和DeepSeek AI中顯著應用,但Google的應用將其提升到一個新水平。
在他們的技術論文中,包括Juraj Gottweis在內的Google研究人員強調,他們的工作建立在DeepSeek的R1模型開創的進展基礎上。他們提出利用從科學方法中衍生的歸納偏見,顯著擴展測試時計算,建立科學推理和假設生成的多代理框架。
AI共同科學家通過API存取外部資源並與網絡搜尋引擎和專業AI模型等工具互動。該系統的一個關鍵特徵是「錦標賽」概念,其中假設使用Elo分數進行比較和排序,類似於國際象棋和體育比賽中使用的分數。排序代理負責組織這些錦標賽,促進模擬的科學辯論,以評估和優先排序假設。
超越模型與無輔助的人類專家
根據十五位人類專家的審查,AI共同科學家的表現隨著其在假設制定和評估上投入更多時間而改善。隨著系統投入更多計算努力,其結果質量超越了未適應的模型如Gemini 2.0和OpenAI的o1,以及無輔助的人類專家。

這些專家指出,AI共同科學家的輸出顯示出更高的創新性和影響力潛力,常常比其他模型更受青睞。雖然AI共同科學家使用的確切計算資源未被披露,但Google表示,隨著計算能力成本的降低,如DeepSeek R1模型所示,這類AI系統可能很快將廣泛應用於研究實驗室。
相關文章
智源WITA以首份合規申報書為「裸體」機器人互動畫下句點
具身智能領域已達成一項重要里程碑。根據上海市網絡信息辦公室的最新公告,智源研究所研發的WITA大模型已成功完成備案,成為國內首個符合規範部署的具身智能交互大模型。這項成就不僅僅是取得許可證。WITA 的核心宗旨在於讓類人型機器人能夠真正進行對話、感知情緒,並發展出鮮明的個性。它專為機器人互動場景設計,透過自然且富有情感表達的溝通方式,將冰冷的機械軀體轉化為具備連續記憶與個人特質的「矽基夥伴」。 作
一項人類學研究指出,經過潤飾的人工智慧產出內容會削弱人類的思考能力
當你看到人工智慧瞬間產出一段結構完善、邏輯清晰的程式碼或文件時,是否會不假思索地選擇相信它?根據AIbase 的報導,領先的人工智慧公司Anthropic最近發布了一份名為《AI 流暢度指數》的研究報告。 在分析了近 10,000 份匿名Claude對話樣本後,這項研究揭露了一個令人擔憂的趨勢:AI 產出的內容看起來越是精緻,使用者就越不願意去查證事實。報告揭示,當Claude產出小型應用程式、網
英國各政府部門就人工智慧資料中心的能源需求產生分歧
英國政府正面臨一項重大挑戰:在推動清潔能源的同時,力求成為人工智慧領域的全球領導者。然而,負責這些目標的各部會之間卻顯現出嚴重的分歧。 科學、創新與技術部(DSIT)與能源安全及淨零部(DESNZ)對於人工智慧資料中心的未來電力需求,持著截然不同的預測。DSIT預測,到2030年,人工智慧資料中心將需要6吉瓦的電力;而DESNZ的估計則不到該數字的十分之一。 這項差距引起了非營利組織「Foxglo
相關專題推薦
評論 (28)
0/500
This AI co-scientist sounds like a game-changer! 😮 Generating hypotheses in record time? I wonder how it stacks up against human researchers in creativity. Could it spark a science revolution or just flood us with half-baked ideas? Exciting times!
This AI co-scientist sounds like a game-changer! Generating hypotheses in no time? I wonder how it stacks up against human researchers in creativity. Exciting stuff! 🚀
This AI co-scientist sounds like a game-changer! Generating hypotheses in a flash? I wonder how it stacks up against human researchers in creativity. Exciting times! 🚀
GoogleのAI共同研究者は驚異的です!🤯 超スマートなラボパートナーを持っているようなもので、すぐに革新的な仮説を出してくれます。研究に革命をもたらすツールですが、もう少しユーザーフレンドリーだといいなと思います。それでも、可能性の境界を押し広げています!🚀
El AI Co-Scientist de Google es impresionante! 🤯 Es como tener un compañero de laboratorio superinteligente que genera hipótesis innovadoras en un abrir y cerrar de ojos. Es un cambio de juego para la investigación, aunque desearía que fuera un poco más fácil de usar. Aún así, está empujando los límites de lo posible! 🚀
O co-cientista de IA do Google é de tirar o fôlego! 🚀 É como ter um parceiro de laboratório superinteligente que vem com novas ideias mais rápido do que eu posso dizer 'hipótese'. O único ponto negativo? Me faz sentir um pouco preguiçoso. Talvez eu deva usá-lo mais para impulsionar minha própria pesquisa!
在週三,Google宣布對其Gemini 2.0大型語言模型進行了一項令人振奮的更新,將其轉化為一個AI共同科學家,能夠在相較於傳統人類主導研究團隊顯著縮短的時間內,生成新穎的科學假設。這個創新的工具旨在協助科學家,通過與人類協作,作為有用的合作夥伴,加速發現過程。
Google宣稱這款AI共同科學家是AI輔助技術的重要進步,承諾將徹底改變科學研究的方式。該系統設計為「人在迴路中」,確保AI從文獻回顧到假設形成的操作,都受到人類輸入的指導。
在一個大膽的舉措中,Google的研究人員與倫敦帝國理工學院的一個團隊共同發表了一篇技術論文,探討細菌如何演化成新病原體的相同假設。AI共同科學家僅用兩天就生成了其假設,與人類研究者長達十年的努力形成鮮明對比。
假設生成機器
Google將AI共同科學家描述為一個「假設生成機器」,利用多個專業化代理。一旦科學家以自然語言輸入研究目標,系統便開始運作,生成假設、研究概述和實驗方案。涉及的代理包括生成、反思、排序、演化、接近度和元審查,這些代理協同工作,推動科學探究的邊界。


該系統不僅僅是回顧現有文獻;它旨在發現原創知識,並針對特定目標制定新穎的研究假設。
極致測試時擴展
將Gemini 2.0改進為AI共同科學家在很大程度上依賴於「測試時擴展」,這是一種技術,AI代理使用越來越多的計算能力來迭代精煉其輸出。這種方法已在其他推理模型如OpenAI的o1和DeepSeek AI中顯著應用,但Google的應用將其提升到一個新水平。
在他們的技術論文中,包括Juraj Gottweis在內的Google研究人員強調,他們的工作建立在DeepSeek的R1模型開創的進展基礎上。他們提出利用從科學方法中衍生的歸納偏見,顯著擴展測試時計算,建立科學推理和假設生成的多代理框架。
AI共同科學家通過API存取外部資源並與網絡搜尋引擎和專業AI模型等工具互動。該系統的一個關鍵特徵是「錦標賽」概念,其中假設使用Elo分數進行比較和排序,類似於國際象棋和體育比賽中使用的分數。排序代理負責組織這些錦標賽,促進模擬的科學辯論,以評估和優先排序假設。
超越模型與無輔助的人類專家
根據十五位人類專家的審查,AI共同科學家的表現隨著其在假設制定和評估上投入更多時間而改善。隨著系統投入更多計算努力,其結果質量超越了未適應的模型如Gemini 2.0和OpenAI的o1,以及無輔助的人類專家。
這些專家指出,AI共同科學家的輸出顯示出更高的創新性和影響力潛力,常常比其他模型更受青睞。雖然AI共同科學家使用的確切計算資源未被披露,但Google表示,隨著計算能力成本的降低,如DeepSeek R1模型所示,這類AI系統可能很快將廣泛應用於研究實驗室。
智源WITA以首份合規申報書為「裸體」機器人互動畫下句點
具身智能領域已達成一項重要里程碑。根據上海市網絡信息辦公室的最新公告,智源研究所研發的WITA大模型已成功完成備案,成為國內首個符合規範部署的具身智能交互大模型。這項成就不僅僅是取得許可證。WITA 的核心宗旨在於讓類人型機器人能夠真正進行對話、感知情緒,並發展出鮮明的個性。它專為機器人互動場景設計,透過自然且富有情感表達的溝通方式,將冰冷的機械軀體轉化為具備連續記憶與個人特質的「矽基夥伴」。 作
一項人類學研究指出,經過潤飾的人工智慧產出內容會削弱人類的思考能力
當你看到人工智慧瞬間產出一段結構完善、邏輯清晰的程式碼或文件時,是否會不假思索地選擇相信它?根據AIbase 的報導,領先的人工智慧公司Anthropic最近發布了一份名為《AI 流暢度指數》的研究報告。 在分析了近 10,000 份匿名Claude對話樣本後,這項研究揭露了一個令人擔憂的趨勢:AI 產出的內容看起來越是精緻,使用者就越不願意去查證事實。報告揭示,當Claude產出小型應用程式、網
英國各政府部門就人工智慧資料中心的能源需求產生分歧
英國政府正面臨一項重大挑戰:在推動清潔能源的同時,力求成為人工智慧領域的全球領導者。然而,負責這些目標的各部會之間卻顯現出嚴重的分歧。 科學、創新與技術部(DSIT)與能源安全及淨零部(DESNZ)對於人工智慧資料中心的未來電力需求,持著截然不同的預測。DSIT預測,到2030年,人工智慧資料中心將需要6吉瓦的電力;而DESNZ的估計則不到該數字的十分之一。 這項差距引起了非營利組織「Foxglo
This AI co-scientist sounds like a game-changer! 😮 Generating hypotheses in record time? I wonder how it stacks up against human researchers in creativity. Could it spark a science revolution or just flood us with half-baked ideas? Exciting times!
This AI co-scientist sounds like a game-changer! Generating hypotheses in no time? I wonder how it stacks up against human researchers in creativity. Exciting stuff! 🚀
This AI co-scientist sounds like a game-changer! Generating hypotheses in a flash? I wonder how it stacks up against human researchers in creativity. Exciting times! 🚀
GoogleのAI共同研究者は驚異的です!🤯 超スマートなラボパートナーを持っているようなもので、すぐに革新的な仮説を出してくれます。研究に革命をもたらすツールですが、もう少しユーザーフレンドリーだといいなと思います。それでも、可能性の境界を押し広げています!🚀
El AI Co-Scientist de Google es impresionante! 🤯 Es como tener un compañero de laboratorio superinteligente que genera hipótesis innovadoras en un abrir y cerrar de ojos. Es un cambio de juego para la investigación, aunque desearía que fuera un poco más fácil de usar. Aún así, está empujando los límites de lo posible! 🚀
O co-cientista de IA do Google é de tirar o fôlego! 🚀 É como ter um parceiro de laboratório superinteligente que vem com novas ideias mais rápido do que eu posso dizer 'hipótese'. O único ponto negativo? Me faz sentir um pouco preguiçoso. Talvez eu deva usá-lo mais para impulsionar minha própria pesquisa!





首頁






