xAI 推出 Grok 4.20,具備強化推理能力與創紀錄的幻覺控制能力
2026年3月12日,xAI 正式發布其新一代大型語言模型Grok 4.20 Beta, 該模型在保持具競爭力的定價的同時,為卓越的事實可靠性樹立了新的產業標準。
根據Artificial Analysis 的最新評估,Grok 4.20 在推理任務中獲得了 48 分的智慧指數,較前一代產品提升了 6 分。 儘管在整體基準測試表現上仍落後於Gemini 3.1 Pro Preview 和GPT-5.4 (兩者均獲得 57 分),但其在 AA Omniscient 測試中的表現卻十分出色,非幻覺率高達 78%。這有效解決了 AI 模型產生虛假資訊的常見問題。

在產品陣容與技術規格方面,xAI 同步推出了三種 API 版本:分別具備推理能力、不具備推理能力,以及專為多代理運作設計的版本。 該模型支援長達 200 萬個標記的上下文視窗,並採用極具競爭力的定價策略,每百萬個標記的費用介於 2 至 6 美元之間——遠低於之前的 Grok 4。技術上,Grok 4.20 在面對陌生領域時展現出強烈的克制力,顯著增加了其承認「我不知道」的傾向,錯誤率約為五分之一。

大型 AI 模型的全球競爭,現已從純粹聚焦於規模,演變為推理深度與事實精準度的雙重角逐。 Grok 4.20 的推出,彰顯了 xAI 在追求通用人工智慧(AGI)的過程中,透過優先考量「誠實」與「低幻覺率」來建立獨特競爭優勢的策略。這種對事實可靠性的極致堅持,不僅提升了 AI 在嚴謹產業中的實用價值,更為未來多代理系統中的資訊完整性奠定了更值得信賴的基礎。
相關文章
北京工業大學就包括人工智慧模型上下文協議在內的121項行業標準徵求公眾意見
中國工業和資訊化部正式釋出通知,徵求公眾對121項行業標準化的意見,其中包括“人工智慧安全治理模型上下文協議的應用安全要求”。這一公告標誌著中國在建立人工智慧基礎標準和安全監管框架方面取得了重要進展。此次公開徵求意見的重點是針對該模型上下文協議的應用安全問題,旨在透過標準化的技術規範來解決多模態互動、長文字處理以及跨平臺呼叫過程中出現的協議相容性和資料安全方面的問題。
OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295%
公眾憤怒:OpenAI的軍事合作引發“解除安裝潮”近日,人工智慧領域的領頭羊OpenAI宣佈與美國國防部建立了深度合作關係,將其人工智慧模型整合到高度機密的軍事網路中。這一訊息在美國引發了廣泛的使用者抗議,“抵制ChatGPT”運動勢頭日益強勁。根據市場分析機構Sensor Tower的資料,2026年2月28日——OpenAI正式宣佈這一合作的當天——美國市場上ChatGPT移動應用的解除安裝率比前一天激增了295%,而此前該應用的平均每日解除安裝率約為9%。使用者們對人工智慧被用於軍事目的表示強烈擔憂,
OpenAI 推出「Sites」功能,以文字驅動的網站標誌著「無程式碼」時代的終結
OpenAI 推出了「Sites」,這是其軟體工程人工智慧平台 Codex 的一項新功能。目前該功能處於預覽階段,僅限付費的「Business」和「Enterprise」訂閱用戶使用,旨在消除網頁與應用程式開發中的傳統障礙。從核心功能來看,Sites 是一個能將抽象概念轉化為實用工具的平台。使用者可輸入概念、數據分析或專案計畫,Codex 便會自動將這些靜態內容重組為儀表板、排程規劃器、審查工作區
相關專題推薦
評論 (1)
0/500
2026年3月12日,xAI 正式發布其新一代大型語言模型
根據

在產品陣容與技術規格方面,xAI 同步推出了三種 API 版本:分別具備推理能力、不具備推理能力,以及專為多代理運作設計的版本。 該模型支援長達 200 萬個標記的上下文視窗,並採用極具競爭力的定價策略,每百萬個標記的費用介於 2 至 6 美元之間——遠低於之前的 Grok 4。技術上,Grok 4.20 在面對陌生領域時展現出強烈的克制力,顯著增加了其承認「我不知道」的傾向,錯誤率約為五分之一。

大型 AI 模型的全球競爭,現已從純粹聚焦於規模,演變為推理深度與事實精準度的雙重角逐。 Grok 4.20 的推出,彰顯了 xAI 在追求通用人工智慧(AGI)的過程中,透過優先考量「誠實」與「低幻覺率」來建立獨特競爭優勢的策略。這種對事實可靠性的極致堅持,不僅提升了 AI 在嚴謹產業中的實用價值,更為未來多代理系統中的資訊完整性奠定了更值得信賴的基礎。
北京工業大學就包括人工智慧模型上下文協議在內的121項行業標準徵求公眾意見
中國工業和資訊化部正式釋出通知,徵求公眾對121項行業標準化的意見,其中包括“人工智慧安全治理模型上下文協議的應用安全要求”。這一公告標誌著中國在建立人工智慧基礎標準和安全監管框架方面取得了重要進展。此次公開徵求意見的重點是針對該模型上下文協議的應用安全問題,旨在透過標準化的技術規範來解決多模態互動、長文字處理以及跨平臺呼叫過程中出現的協議相容性和資料安全方面的問題。
OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295%
公眾憤怒:OpenAI的軍事合作引發“解除安裝潮”近日,人工智慧領域的領頭羊OpenAI宣佈與美國國防部建立了深度合作關係,將其人工智慧模型整合到高度機密的軍事網路中。這一訊息在美國引發了廣泛的使用者抗議,“抵制ChatGPT”運動勢頭日益強勁。根據市場分析機構Sensor Tower的資料,2026年2月28日——OpenAI正式宣佈這一合作的當天——美國市場上ChatGPT移動應用的解除安裝率比前一天激增了295%,而此前該應用的平均每日解除安裝率約為9%。使用者們對人工智慧被用於軍事目的表示強烈擔憂,
OpenAI 推出「Sites」功能,以文字驅動的網站標誌著「無程式碼」時代的終結
OpenAI 推出了「Sites」,這是其軟體工程人工智慧平台 Codex 的一項新功能。目前該功能處於預覽階段,僅限付費的「Business」和「Enterprise」訂閱用戶使用,旨在消除網頁與應用程式開發中的傳統障礙。從核心功能來看,Sites 是一個能將抽象概念轉化為實用工具的平台。使用者可輸入概念、數據分析或專案計畫,Codex 便會自動將這些靜態內容重組為儀表板、排程規劃器、審查工作區





首頁






