選項
首頁
新聞
xAI 推出 Grok 4.20,具備強化推理能力與創紀錄的幻覺控制能力

xAI 推出 Grok 4.20,具備強化推理能力與創紀錄的幻覺控制能力

2026-03-28
311

2026年3月12日,xAI 正式發布其新一代大型語言模型Grok 4.20 Beta,該模型在保持具競爭力的定價的同時,為卓越的事實可靠性樹立了新的產業標準。

根據Artificial Analysis 的最新評估,Grok 4.20 在推理任務中獲得了 48 分的智慧指數,較前一代產品提升了 6 分。 儘管在整體基準測試表現上仍落後於Gemini 3.1 Pro PreviewGPT-5.4(兩者均獲得 57 分),但其在 AA Omniscient 測試中的表現卻十分出色,非幻覺率高達 78%。這有效解決了 AI 模型產生虛假資訊的常見問題。

QQ20260313-091756.jpg

在產品陣容與技術規格方面,xAI 同步推出了三種 API 版本:分別具備推理能力、不具備推理能力,以及專為多代理運作設計的版本。 該模型支援長達 200 萬個標記的上下文視窗,並採用極具競爭力的定價策略,每百萬個標記的費用介於 2 至 6 美元之間——遠低於之前的 Grok 4。技術上,Grok 4.20 在面對陌生領域時展現出強烈的克制力,顯著增加了其承認「我不知道」的傾向,錯誤率約為五分之一。

Grok、馬斯克、xAI

大型 AI 模型的全球競爭,現已從純粹聚焦於規模,演變為推理深度與事實精準度的雙重角逐。 Grok 4.20 的推出,彰顯了 xAI 在追求通用人工智慧(AGI)的過程中,透過優先考量「誠實」與「低幻覺率」來建立獨特競爭優勢的策略。這種對事實可靠性的極致堅持,不僅提升了 AI 在嚴謹產業中的實用價值,更為未來多代理系統中的資訊完整性奠定了更值得信賴的基礎。

相關文章
北京工業大學就包括人工智慧模型上下文協議在內的121項行業標準徵求公眾意見 北京工業大學就包括人工智慧模型上下文協議在內的121項行業標準徵求公眾意見 中國工業和資訊化部正式釋出通知,徵求公眾對121項行業標準化的意見,其中包括“人工智慧安全治理模型上下文協議的應用安全要求”。這一公告標誌著中國在建立人工智慧基礎標準和安全監管框架方面取得了重要進展。此次公開徵求意見的重點是針對該模型上下文協議的應用安全問題,旨在透過標準化的技術規範來解決多模態互動、長文字處理以及跨平臺呼叫過程中出現的協議相容性和資料安全方面的問題。
OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295% OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295% 公眾憤怒:OpenAI的軍事合作引發“解除安裝潮”近日,人工智慧領域的領頭羊OpenAI宣佈與美國國防部建立了深度合作關係,將其人工智慧模型整合到高度機密的軍事網路中。這一訊息在美國引發了廣泛的使用者抗議,“抵制ChatGPT”運動勢頭日益強勁。根據市場分析機構Sensor Tower的資料,2026年2月28日——OpenAI正式宣佈這一合作的當天——美國市場上ChatGPT移動應用的解除安裝率比前一天激增了295%,而此前該應用的平均每日解除安裝率約為9%。使用者們對人工智慧被用於軍事目的表示強烈擔憂,
OpenAI 推出「Sites」功能,以文字驅動的網站標誌著「無程式碼」時代的終結 OpenAI 推出「Sites」功能,以文字驅動的網站標誌著「無程式碼」時代的終結 OpenAI 推出了「Sites」,這是其軟體工程人工智慧平台 Codex 的一項新功能。目前該功能處於預覽階段,僅限付費的「Business」和「Enterprise」訂閱用戶使用,旨在消除網頁與應用程式開發中的傳統障礙。從核心功能來看,Sites 是一個能將抽象概念轉化為實用工具的平台。使用者可輸入概念、數據分析或專案計畫,Codex 便會自動將這些靜態內容重組為儀表板、排程規劃器、審查工作區
相關專題推薦
視頻創作 最適合劇本創作與視覺敘事的 AI 文字轉影片平台
最適合劇本創作與視覺敘事的 AI 文字轉影片平台

2026 年最新最佳 AI 文字轉影片平台:頂級劇本撰寫與視覺敘事工具。探索強大且顛覆傳統的解決方案,將您的文字轉化為引人入勝的影片。透過我們每週更新的排行榜與實際測試,比較免費與付費選項。找到最適合您的平台,提升創造力與生產力。立即探索 XIX.AI 精選推薦。

10 個工具
xix.ai
聊天機器人 AI多智慧體編排器:透過自然語言設計複雜的自動化工作流程
AI多智慧體編排器:透過自然語言設計複雜的自動化工作流程

2026最新資訊:探索最優秀的人工智慧多智慧體協調工具,透過自然語言設計複雜的自動化工作流程。我們精心挑選的列表中包含了評分最高、功能強大的平臺,這些平臺能夠實現無縫的任務自動化和智慧化的流程管理。對比免費與付費選項,並瞭解實際應用中的效果。藉助XIX.AI每週更新的專家排名,讓你在人工智慧領域取得領先優勢。

10 個工具
xix.ai
圖像編輯 最佳AI降噪軟體:消除低光夜間攝影中的顆粒感和偽影
最佳AI降噪軟體:消除低光夜間攝影中的顆粒感和偽影

探索2026年最適合低光夜間攝影的AI降噪軟體。我們精心挑選了最受歡迎的免費及付費工具,透過實際測試並每週更新排名來進行對比。輕鬆去除影象中的顆粒感與瑕疵,在XIX.AI上釋放你的AI潛力。

10 個工具
xix.ai
聊天機器人 最佳客製化 AI 女友生成器:設計獨特的個性、興趣與背景故事
最佳客製化 AI 女友生成器:設計獨特的個性、興趣與背景故事

在 XIX.AI 探索 2026 年最佳的客製化 AI 女友生成器。瀏覽我們精心挑選的高評分清單,設計獨特的個性、興趣與深入的背景故事。透過實際使用心得,比較免費與付費選項。立即解鎖您完美的創意夥伴。

10 個工具
xix.ai
生產率 AI 架構設計師:運用自然語言建構可擴展的系統架構
AI 架構設計師:運用自然語言建構可擴展的系統架構

立即在 XIX.AI 探索 2026 年最佳 AI 架構設計工具。我們精心挑選並廣受好評的清單,匯集了強大且具革命性的解決方案,讓您能透過自然語言建構可擴展的系統架構。透過實務見解,比較免費與付費選項的差異。立即釋放您的 AI 優勢,並簡化開發流程。

10 個工具
xix.ai
漫畫創作 AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料
AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料

2026年最新最佳AI角色建立工具:發現那些備受好評的工具,它們能夠幫助你為漫畫角色生成詳細的背景故事和視覺素材。我們精心整理的這份每週更新的列表會根據實際測試結果,對比免費與付費選項的優劣。找到這些強大且能改變創作流程的工具,幫助你塑造引人入勝的角色,提升創作效率。立即訪問XIX.AI檢視排名,找到最適合你的故事創作助手吧。

10 個工具
xix.ai
評論 (1)
0/500
NicholasLee
NicholasLee 2026-04-27 18:00:25

Grok 4.20 Beta 這次在幻覺控制上好像真的進步了?看簡介說設了新標準,有點期待實際用起來是不是真的那麼可靠。價格有競爭力是好事,但希望別像有些模型,一更新舊功能反而變差。🤔

OR