选项
首页
新闻
xAI 发布 Grok 4.20,具备增强的推理能力及创纪录的幻觉控制能力

xAI 发布 Grok 4.20,具备增强的推理能力及创纪录的幻觉控制能力

2026-03-28
311

2026年3月12日,xAI正式发布了其新一代大型语言模型Grok 4.20 Beta版,该模型在保持极具竞争力的价格的同时,为卓越的事实可靠性树立了新的行业标准。

根据Artificial Analysis的最新评估,Grok 4.20在推理任务中获得了48分的智能指数,较前代产品提升了6分。 尽管在整体基准性能上仍落后于Gemini 3.1 Pro PreviewGPT-5.4(两者均获57分),但其在AA全知测试中的表现尤为突出,无幻觉率高达78%。这有效解决了AI模型生成虚假信息的普遍问题。

QQ20260313-091756.jpg

在产品阵容和技术规格方面,xAI 同步推出了三个 API 版本:一个具备推理能力,一个不具备,还有一款专为多智能体协作设计。 该模型支持高达200万令牌的上下文窗口,并采用极具竞争力的定价策略,每百万令牌成本仅为2至6美元——远低于此前Grok 4的定价。从技术层面看,Grok 4.20在面对陌生领域时表现出强烈的克制,显著提高了承认“我不知道”的倾向,其错误率约为五分之一。

Grok、马斯克、xAI

大型AI模型的全球竞争已从单纯追求规模,演变为推理深度与事实准确性的双重角逐。 Grok 4.20的发布彰显了xAI的战略方向:在追求通用人工智能(AGI)的过程中,通过优先确保“诚实”和“低幻觉率”来构建独特的竞争优势。这种对事实可靠性的极致追求,不仅提升了AI在严谨行业中的实际应用价值,也为未来多智能体系统中的信息完整性奠定了更值得信赖的基础。

相关文章
阿里巴巴2026财年第四季度财报:AI营收激增,百联平台ARR突破100亿元 阿里巴巴2026财年第四季度财报:AI营收激增,百联平台ARR突破100亿元 阿里巴巴集团今日公布了2026财年第四季度及全年财报,数据显示其以人工智能为驱动的云业务正呈现爆发式增长。 财报显示,第四财季营收达2433.8亿元,剔除已剥离业务后同比增长11%,其中AI模型及应用服务表现尤为亮眼。阿里云的“百联”MaaS平台年经常性收入(ARR)已突破80亿元,并有望在本季度跨越100亿元大关。这一增长主要得益于自主研发的通一千文大模型家族提供的API服务以及AI原生软件订阅
埃隆·马斯克在针对山姆·奥尔特曼和OpenAI的诉讼中败诉 埃隆·马斯克在针对山姆·奥尔特曼和OpenAI的诉讼中败诉 埃隆·马斯克声称OpenAI的联合创始人亏待了他,但这一说法在九名加州陪审员一致裁定他的诉讼提起得太晚之后被推翻了。 马斯克指控萨姆·奥尔特曼、格雷格·布罗克曼、OpenAI以及微软通过成立这个高级人工智能实验室的盈利机构“窃取了一笔慈善资金”。然而,陪审员们认定,马斯克可能遭受的任何损失都发生在他提起诉讼的法律截止日期之前。 尽管这场审判深入探讨了OpenAI的发展历程,并有硅谷知名人物的证词,但最终它还是围绕一些相对具体的法律问题展开的。诉讼的核心在于奥尔特曼和其他被告是否以及何时向
请提供文章标题,以便将其改写为问题。 请提供文章标题,以便将其改写为问题。 在当今的数字环境中,人工智能正在全面重塑各行各业,博客领域也不例外。博主们一直在寻找方法来优化工作流程、提升内容质量并加强搜索引擎优化(SEO)。 幸运的是,各类人工智能工具都能助您实现这些目标。本文将介绍2025年每位博主工具箱中都应配备的五大AI工具——这些并非泛泛之选,而是我个人运营博客时所依赖的得力助手。它们彻底改变了我处理内容创作、SEO以及受众互动的方式。重点摘要ChatGPT:非常适
相关专题推荐
图像编辑 最佳AI降噪软件:消除低光夜间摄影中的颗粒感和伪影
最佳AI降噪软件:消除低光夜间摄影中的颗粒感和伪影

探索2026年最适合低光夜间摄影的AI降噪软件。我们精心挑选了最受欢迎的免费及付费工具,通过实际测试并每周更新排名来进行对比。轻松去除图像中的颗粒感与瑕疵,在XIX.AI上释放你的AI潜力。

10 个工具
xix.ai
聊天机器人 最佳定制AI女友生成器:设计独特的个性、爱好和背景故事
最佳定制AI女友生成器:设计独特的个性、爱好和背景故事

在 XIX.AI 上探索 2026 年最佳定制 AI 女友生成器。浏览我们精心挑选的高评分清单,设计独一无二的个性、爱好和深入的背景故事。结合真实用户反馈,对比免费与付费选项。立即解锁您完美的创意伴侣。

10 个工具
xix.ai
生产率 AI 架构设计师:利用自然语言构建可扩展的系统架构
AI 架构设计师:利用自然语言构建可扩展的系统架构

在 XIX.AI 上探索 2026 年最佳 AI 架构设计工具。我们精心筛选并广受好评的这份清单,汇集了功能强大且具有颠覆性的解决方案,助您通过自然语言构建可扩展的系统架构。结合实际应用案例,对比免费与付费选项。立即释放您的 AI 优势,优化开发流程。

10 个工具
xix.ai
漫画创作 AI角色创建工具:为漫画主角生成详细的背景故事及视觉参考资料
AI角色创建工具:为漫画主角生成详细的背景故事及视觉参考资料

2026年最新最佳AI角色创建工具:发现那些备受好评的工具,它们能够帮助你为漫画角色生成详细的背景故事和视觉素材。我们精心整理的这份每周更新的列表会根据实际测试结果,对比免费与付费选项的优劣。找到这些强大且能改变创作流程的工具,帮助你塑造引人入胜的角色,提升创作效率。立即访问XIX.AI查看排名,找到最适合你的故事创作助手吧。

10 个工具
xix.ai
健康养生 AI孕期伴侣:生成安全可靠的各孕期运动与营养计划
AI孕期伴侣:生成安全可靠的各孕期运动与营养计划

探索2026年最佳AI孕期伴侣,获取安全、个性化的各孕期运动与营养计划。获取经过精心筛选的高评分推荐,包含免费与付费版本的对比分析及真实用户反馈。借助XIX.AI的专家指南,开启您最健康的孕期之旅。立即探索。

10 个工具
xix.ai
写作 最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字
最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字

在 XIX.AI 探索 2026 年最佳免费且难以被察觉的 AI 写作工具。我们精心筛选的顶级推荐清单,助您将生硬的草稿转化为自然流畅、宛如人类撰写的文字。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即解锁您的 AI 写作优势。

10 个工具
xix.ai
评论 (1)
0/500
NicholasLee
NicholasLee 2026-04-27 18:00:25

Grok 4.20 Beta 這次在幻覺控制上好像真的進步了?看簡介說設了新標準,有點期待實際用起來是不是真的那麼可靠。價格有競爭力是好事,但希望別像有些模型,一更新舊功能反而變差。🤔

OR