OpenAI 的人工智慧解題器破解了這道存在數十年的數學難題,並推翻了一項幾何猜想
數學界剛剛見證了一項里程碑式的成就。OpenAI 近日宣布,其最新的內部推理模型已成功生成一份原創的數學證明,正式推翻了由著名數學家保羅·埃爾德什(Paul Erdős)於 1946 年首次提出的「單位距離猜想」。這項里程碑式的成就標誌著,人工智慧首次透過其先進的長鏈推理,獨立解決了純數學領域中的未解問題。

超越資料檢索:獨立專家驗證
值得注意的是,就在七個月前,OpenAI 因聲稱解決了數個埃爾德什問題,卻被指控「從文獻中檢索現有答案」且缺乏真正的原創性,而面臨學術界的批評。吸取此次經驗,該公司主動邀請包括湯瑪斯·布魯姆(Thomas Bloom)在內的國際知名數學家小組進行獨立驗證。此證明之嚴謹性,此後已獲得多位專家的明確支持。
歷史上,人工智慧在數學領域的成就主要限於重新證明人類已知的定理。然而,此推理模型卻從根本上挑戰了近八十年來被普遍接受的數學認知。數學家們通常假設該猜想的最佳解將呈現網格狀的排列。OpenAI 的模型則偏離了這條路徑,獨立發現了一種能帶來更優異表現的新穎構建方法。
克服「幻覺」:對前沿科學的啟示
從技術角度來看,解決此類開放性數學問題對人工智慧的邏輯連貫性提出了嚴苛要求。數學證明涉及眾多複雜的演繹步驟,其中單一錯誤便可能使整個推導鏈失效。此次成功表明,該模型已實質性地克服了傳統大型語言模型中普遍存在的「幻覺」問題。
儘管部分學者指出,該證明尚需時日進行全面的同儕審查,但其潛在的連鎖效應已引起廣泛關注。單位距離猜想與組合幾何學及圖論密切相關。預期這項突破將直接影響未來各領域的研究,包括生物學中的蛋白質摺疊、材料科學中的晶體結構分析,以及藥用分子的設計與優化。
相關文章
百度健康內部測試 AI 醫生助理「DoctorClaw」,短期內將用於學術資料檢索與辦公室輔助
據報導,百度健康已開始對一款專為醫師設計的專業 AI 智慧助理進行內部測試。這款內部代號為「DoctorClaw」(龍蝦醫生版)的產品,標誌著百度在醫療領域部署大型語言模型方面邁出了重要一步。知情人士透露,該專案目前仍處於封閉開發階段,現已進入內部測試。雖然具體產品形式尚未完全公開,但已接近推出。 就功能而言,DoctorClaw 初期將聚焦於學術文獻檢索與常規診間輔助。然而,其長期戰略旨在深度融
《Cursor Composer 2》對決《Claude Opus 4.6》:效能測試引發新一輪 AI 程式設計辯論
3月19日,Cursor 正式發布其自主研發的編碼模型 Composer 2。 這項公告在開發者社群中立即引發熱議——根據 Cursor 的說法,Composer 2 在 Terminal-Bench 2.0 上的得分為 61.7%,在相同的測試條件下,顯著超越了 Claude Opus 4.6 的 58.0%。Anthropic 的旗艦模型,竟被自家 IDE 內建的模型超越?隨著消息傳開,相關辯
StrictlyVC 舊金山站將匯聚 TDK Ventures、Replit 等企業的領導者
今年首場 StrictlyVC 活動即將在舊金山登場,時間比你想像的還要快。 4月30日於菲律賓文化中心(Sentro Filipino Cultural Center)舉辦的聚會門票現仍開放購買,現場將有陣容強大的講者陣容。除了StrictlyVC一貫以人脈拓展與社群互動著稱外,這場舊金山活動對於尋求最新募資洞見的人工智慧創新者與創辦人而言,將具有特別的價值。誰將登上舞台門票現已開售,但若您尚未
相關專題推薦
評論 (0)
0/500
數學界剛剛見證了一項里程碑式的成就。OpenAI 近日宣布,其最新的內部推理模型已成功生成一份原創的數學證明,正式推翻了由著名數學家保羅·埃爾德什(Paul Erdős)於 1946 年首次提出的「單位距離猜想」。這項里程碑式的成就標誌著,人工智慧首次透過其先進的長鏈推理,獨立解決了純數學領域中的未解問題。

超越資料檢索:獨立專家驗證
值得注意的是,就在七個月前,OpenAI 因聲稱解決了數個埃爾德什問題,卻被指控「從文獻中檢索現有答案」且缺乏真正的原創性,而面臨學術界的批評。吸取此次經驗,該公司主動邀請包括湯瑪斯·布魯姆(Thomas Bloom)在內的國際知名數學家小組進行獨立驗證。此證明之嚴謹性,此後已獲得多位專家的明確支持。
歷史上,人工智慧在數學領域的成就主要限於重新證明人類已知的定理。然而,此推理模型卻從根本上挑戰了近八十年來被普遍接受的數學認知。數學家們通常假設該猜想的最佳解將呈現網格狀的排列。OpenAI 的模型則偏離了這條路徑,獨立發現了一種能帶來更優異表現的新穎構建方法。
克服「幻覺」:對前沿科學的啟示
從技術角度來看,解決此類開放性數學問題對人工智慧的邏輯連貫性提出了嚴苛要求。數學證明涉及眾多複雜的演繹步驟,其中單一錯誤便可能使整個推導鏈失效。此次成功表明,該模型已實質性地克服了傳統大型語言模型中普遍存在的「幻覺」問題。
儘管部分學者指出,該證明尚需時日進行全面的同儕審查,但其潛在的連鎖效應已引起廣泛關注。單位距離猜想與組合幾何學及圖論密切相關。預期這項突破將直接影響未來各領域的研究,包括生物學中的蛋白質摺疊、材料科學中的晶體結構分析,以及藥用分子的設計與優化。
百度健康內部測試 AI 醫生助理「DoctorClaw」,短期內將用於學術資料檢索與辦公室輔助
據報導,百度健康已開始對一款專為醫師設計的專業 AI 智慧助理進行內部測試。這款內部代號為「DoctorClaw」(龍蝦醫生版)的產品,標誌著百度在醫療領域部署大型語言模型方面邁出了重要一步。知情人士透露,該專案目前仍處於封閉開發階段,現已進入內部測試。雖然具體產品形式尚未完全公開,但已接近推出。 就功能而言,DoctorClaw 初期將聚焦於學術文獻檢索與常規診間輔助。然而,其長期戰略旨在深度融
《Cursor Composer 2》對決《Claude Opus 4.6》:效能測試引發新一輪 AI 程式設計辯論
3月19日,Cursor 正式發布其自主研發的編碼模型 Composer 2。 這項公告在開發者社群中立即引發熱議——根據 Cursor 的說法,Composer 2 在 Terminal-Bench 2.0 上的得分為 61.7%,在相同的測試條件下,顯著超越了 Claude Opus 4.6 的 58.0%。Anthropic 的旗艦模型,竟被自家 IDE 內建的模型超越?隨著消息傳開,相關辯
StrictlyVC 舊金山站將匯聚 TDK Ventures、Replit 等企業的領導者
今年首場 StrictlyVC 活動即將在舊金山登場,時間比你想像的還要快。 4月30日於菲律賓文化中心(Sentro Filipino Cultural Center)舉辦的聚會門票現仍開放購買,現場將有陣容強大的講者陣容。除了StrictlyVC一貫以人脈拓展與社群互動著稱外,這場舊金山活動對於尋求最新募資洞見的人工智慧創新者與創辦人而言,將具有特別的價值。誰將登上舞台門票現已開售,但若您尚未





首頁






