xAI 发布 Grok 4.20,具备增强的推理能力及创纪录的幻觉控制能力
2026年3月12日,xAI正式发布了其新一代大型语言模型Grok 4.20 Beta版, 该模型在保持极具竞争力的价格的同时,为卓越的事实可靠性树立了新的行业标准。
根据Artificial Analysis 的最新评估,Grok 4.20在推理任务中获得了48分的智能指数,较前代产品提升了6分。 尽管在整体基准性能上仍落后于Gemini 3.1 Pro Preview 和GPT-5.4 (两者均获57分),但其在AA全知测试中的表现尤为突出,无幻觉率高达78%。这有效解决了AI模型生成虚假信息的普遍问题。

在产品阵容和技术规格方面,xAI 同步推出了三个 API 版本:一个具备推理能力,一个不具备,还有一款专为多智能体协作设计。 该模型支持高达200万令牌的上下文窗口,并采用极具竞争力的定价策略,每百万令牌成本仅为2至6美元——远低于此前Grok 4的定价。从技术层面看,Grok 4.20在面对陌生领域时表现出强烈的克制,显著提高了承认“我不知道”的倾向,其错误率约为五分之一。

大型AI模型的全球竞争已从单纯追求规模,演变为推理深度与事实准确性的双重角逐。 Grok 4.20的发布彰显了xAI的战略方向:在追求通用人工智能(AGI)的过程中,通过优先确保“诚实”和“低幻觉率”来构建独特的竞争优势。这种对事实可靠性的极致追求,不仅提升了AI在严谨行业中的实际应用价值,也为未来多智能体系统中的信息完整性奠定了更值得信赖的基础。
相关文章
阿里巴巴2026财年第四季度财报:AI营收激增,百联平台ARR突破100亿元
阿里巴巴集团今日公布了2026财年第四季度及全年财报,数据显示其以人工智能为驱动的云业务正呈现爆发式增长。 财报显示,第四财季营收达2433.8亿元,剔除已剥离业务后同比增长11%,其中AI模型及应用服务表现尤为亮眼。阿里云的“百联”MaaS平台年经常性收入(ARR)已突破80亿元,并有望在本季度跨越100亿元大关。这一增长主要得益于自主研发的通一千文大模型家族提供的API服务以及AI原生软件订阅
埃隆·马斯克在针对山姆·奥尔特曼和OpenAI的诉讼中败诉
埃隆·马斯克声称OpenAI的联合创始人亏待了他,但这一说法在九名加州陪审员一致裁定他的诉讼提起得太晚之后被推翻了。 马斯克指控萨姆·奥尔特曼、格雷格·布罗克曼、OpenAI以及微软通过成立这个高级人工智能实验室的盈利机构“窃取了一笔慈善资金”。然而,陪审员们认定,马斯克可能遭受的任何损失都发生在他提起诉讼的法律截止日期之前。 尽管这场审判深入探讨了OpenAI的发展历程,并有硅谷知名人物的证词,但最终它还是围绕一些相对具体的法律问题展开的。诉讼的核心在于奥尔特曼和其他被告是否以及何时向
请提供文章标题,以便将其改写为问题。
在当今的数字环境中,人工智能正在全面重塑各行各业,博客领域也不例外。博主们一直在寻找方法来优化工作流程、提升内容质量并加强搜索引擎优化(SEO)。 幸运的是,各类人工智能工具都能助您实现这些目标。本文将介绍2025年每位博主工具箱中都应配备的五大AI工具——这些并非泛泛之选,而是我个人运营博客时所依赖的得力助手。它们彻底改变了我处理内容创作、SEO以及受众互动的方式。重点摘要ChatGPT:非常适
相关专题推荐
评论 (1)
0/500
2026年3月12日,xAI正式发布了其新一代大型语言

在产品阵容和技术规格方面,xAI 同步推出了三个 API 版本:一个具备推理能力,一个不具备,还有一款专为多智能体协作设计。 该模型支持高达200万令牌的上下文窗口,并采用极具竞争力的定价策略,每百万令牌成本仅为2至6美元——远低于此前Grok 4的定价。从技术层面看,Grok 4.20在面对陌生领域时表现出强烈的克制,显著提高了承认“我不知道”的倾向,其错误率约为五分之一。

大型AI模型的全球竞争已从单纯追求规模,演变为推理深度与事实准确性的双重角逐。 Grok 4.20的发布彰显了xAI的战略方向:在追求通用人工智能(AGI)的过程中,通过优先确保“诚实”和“低幻觉率”来构建独特的竞争优势。这种对事实可靠性的极致追求,不仅提升了AI在严谨行业中的实际应用价值,也为未来多智能体系统中的信息完整性奠定了更值得信赖的基础。
阿里巴巴2026财年第四季度财报:AI营收激增,百联平台ARR突破100亿元
阿里巴巴集团今日公布了2026财年第四季度及全年财报,数据显示其以人工智能为驱动的云业务正呈现爆发式增长。 财报显示,第四财季营收达2433.8亿元,剔除已剥离业务后同比增长11%,其中AI模型及应用服务表现尤为亮眼。阿里云的“百联”MaaS平台年经常性收入(ARR)已突破80亿元,并有望在本季度跨越100亿元大关。这一增长主要得益于自主研发的通一千文大模型家族提供的API服务以及AI原生软件订阅
埃隆·马斯克在针对山姆·奥尔特曼和OpenAI的诉讼中败诉
埃隆·马斯克声称OpenAI的联合创始人亏待了他,但这一说法在九名加州陪审员一致裁定他的诉讼提起得太晚之后被推翻了。 马斯克指控萨姆·奥尔特曼、格雷格·布罗克曼、OpenAI以及微软通过成立这个高级人工智能实验室的盈利机构“窃取了一笔慈善资金”。然而,陪审员们认定,马斯克可能遭受的任何损失都发生在他提起诉讼的法律截止日期之前。 尽管这场审判深入探讨了OpenAI的发展历程,并有硅谷知名人物的证词,但最终它还是围绕一些相对具体的法律问题展开的。诉讼的核心在于奥尔特曼和其他被告是否以及何时向
请提供文章标题,以便将其改写为问题。
在当今的数字环境中,人工智能正在全面重塑各行各业,博客领域也不例外。博主们一直在寻找方法来优化工作流程、提升内容质量并加强搜索引擎优化(SEO)。 幸运的是,各类人工智能工具都能助您实现这些目标。本文将介绍2025年每位博主工具箱中都应配备的五大AI工具——这些并非泛泛之选,而是我个人运营博客时所依赖的得力助手。它们彻底改变了我处理内容创作、SEO以及受众互动的方式。重点摘要ChatGPT:非常适





首页






