DeepMind 最新人工智能巧妙解決複雜的數學與科學問題
Google 知名的人工智慧研究部門 DeepMind 發表了 AlphaEvolve,這是一套創新系統,旨在以可驗證的解決方案來處理複雜的計算問題。AlphaEvolve 是一套創新系統,旨在解決複雜的計算問題,並提供可驗證的解決方案。早期測試顯示,該系統在優化 Google 的 AI 訓練基礎架構方面具有良好的應用前景,目前正計劃開發使用者介面,並在可能的更廣泛發佈之前啟動學術預覽計畫。
AI 系統通常要面對幻覺的挑戰,概率架構會產生可信但不準確的輸出。值得注意的是,一些現代模型比起它們的前輩,表現出更多的幻覺傾向。AlphaEvolve 引進了一個新穎的驗證框架,透過自動評估 (產生多個候選解決方案、對其進行嚴格評估,並針對準確度對回應進行評分) 來緩解這個問題。
雖然 AlphaEvolve 並非第一個採用此方法的系統,但它透過與 Gemini 模型的整合而脫穎而出,根據 DeepMind 的說法,AlphaEvolve 可實現更優異的效能。操作工作流程要求使用者輸入問題以及可選的情境元素,例如技術規格、程式碼範例或參考資料,再加上解決方案評分的評估機制。

DeepMind 研究人員表示,AlphaEvolve 的目標是領域專家使用者圖片來源:DeepMind
目前的功能著重於電腦科學與最佳化領域中可演算解決的挑戰,對於非數學問題則有固有的限制。跨數學學科的效能基準顯示,重新發現最佳解決方案的成功率為 75%,現有答案的改善率為 20%。
實際應用展現了資源最佳化的潛力,包括恢復 Google 基礎架構的大量運算能力,以及縮短模型訓練時間。儘管沒有實現根本性的突破,但這套系統證明了其在營運效率上的價值 - 自動化例行優化,讓人類專家能專注於更高價值的研究。
TechCrunch AI 活動
領先業界的會議,由來自主要 AI 組織的講者主講,292 美元即可獲得完整的簡報、研討會和交流機會。
提供展覽空間,向 1,200 多位技術決策者展示創新成果。
加州柏克萊市 | 6月5日
初步評估顯示 AlphaEvolve 最強大的價值主張在於增強而非取代人類的專業知識,結合人工智能的計算優勢與專業領域知識,加速目標技術領域的解決方案開發。
相關文章
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
YouTube 測試由人工智慧驅動的搜尋功能,提供引導式答案
許多用戶在搜尋食譜或旅遊計畫時,都會轉向 YouTube 尋找相關影片。如今,該平台推出了一款由人工智慧驅動的互動式搜尋工具,能提供結合文字與影片內容的逐步指引結果。透過全新的「Ask YouTube」功能,使用者可以提出諸如「規劃從舊金山到聖塔芭芭拉的 3 天自駕遊」這類問題,並獲得結合文字、短片片段及較長影片的逐步指引結果——而非僅顯示影片結果。YouTube 表示,系統將同時顯示影片、相關片
相關專題推薦
評論 (1)
0/500
Google 知名的人工智慧研究部門 DeepMind 發表了 AlphaEvolve,這是一套創新系統,旨在以可驗證的解決方案來處理複雜的計算問題。AlphaEvolve 是一套創新系統,旨在解決複雜的計算問題,並提供可驗證的解決方案。早期測試顯示,該系統在優化 Google 的 AI 訓練基礎架構方面具有良好的應用前景,目前正計劃開發使用者介面,並在可能的更廣泛發佈之前啟動學術預覽計畫。
AI 系統通常要面對幻覺的挑戰,概率架構會產生可信但不準確的輸出。值得注意的是,一些現代模型比起它們的前輩,表現出更多的幻覺傾向。AlphaEvolve 引進了一個新穎的驗證框架,透過自動評估 (產生多個候選解決方案、對其進行嚴格評估,並針對準確度對回應進行評分) 來緩解這個問題。
雖然 AlphaEvolve 並非第一個採用此方法的系統,但它透過與 Gemini 模型的整合而脫穎而出,根據 DeepMind 的說法,AlphaEvolve 可實現更優異的效能。操作工作流程要求使用者輸入問題以及可選的情境元素,例如技術規格、程式碼範例或參考資料,再加上解決方案評分的評估機制。

目前的功能著重於電腦科學與最佳化領域中可演算解決的挑戰,對於非數學問題則有固有的限制。跨數學學科的效能基準顯示,重新發現最佳解決方案的成功率為 75%,現有答案的改善率為 20%。
實際應用展現了資源最佳化的潛力,包括恢復 Google 基礎架構的大量運算能力,以及縮短模型訓練時間。儘管沒有實現根本性的突破,但這套系統證明了其在營運效率上的價值 - 自動化例行優化,讓人類專家能專注於更高價值的研究。
TechCrunch AI 活動
領先業界的會議,由來自主要 AI 組織的講者主講,292 美元即可獲得完整的簡報、研討會和交流機會。
提供展覽空間,向 1,200 多位技術決策者展示創新成果。
加州柏克萊市 | 6月5日
初步評估顯示 AlphaEvolve 最強大的價值主張在於增強而非取代人類的專業知識,結合人工智能的計算優勢與專業領域知識,加速目標技術領域的解決方案開發。
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
YouTube 測試由人工智慧驅動的搜尋功能,提供引導式答案
許多用戶在搜尋食譜或旅遊計畫時,都會轉向 YouTube 尋找相關影片。如今,該平台推出了一款由人工智慧驅動的互動式搜尋工具,能提供結合文字與影片內容的逐步指引結果。透過全新的「Ask YouTube」功能,使用者可以提出諸如「規劃從舊金山到聖塔芭芭拉的 3 天自駕遊」這類問題,並獲得結合文字、短片片段及較長影片的逐步指引結果——而非僅顯示影片結果。YouTube 表示,系統將同時顯示影片、相關片





首頁






