选项
首页
新闻
OpenAI 发布 GPT-5.4 Pro 和 Thinking 版本

OpenAI 发布 GPT-5.4 Pro 和 Thinking 版本

2026-05-06
52

OpenAI 发布 GPT-5.4 Pro 和 Thinking 版本

周四,OpenAI 推出了 GPT-5.4,这是一款被描述为“我们目前功能最强大、效率最高的面向专业工作的前沿基础模型”的新模型。除了标准版外,GPT-5.4 还推出了专注于推理的变体(GPT-5.4 Thinking)和性能优化版(GPT-5.4 Pro)。

该模型的API版本将支持高达100万令牌的上下文窗口,这标志着OpenAI迄今为止提供的最大上下文容量。

OpenAI 还强调了令牌效率的提升,指出 GPT-5.4 解决相同问题所需的令牌数量比前代模型显著减少。

该新模型在基准测试中表现大幅提升,在计算机应用基准测试 OSWorld-Verified 和 WebArena Verified 中创下纪录。此外,在 OpenAI 针对知识型工作任务的 GDPval 测试中,其得分达到 83%,同样刷新了纪录。

据 Mercor 首席执行官 Brendan Foody 的声明,GPT-5.4 在 Mercor 的 APEX-Agents 基准测试中表现领先,该测试旨在评估法律和金融领域的专业技能。

“GPT-5.4在生成幻灯片、财务模型和法律分析等长期交付成果方面表现卓越,”福迪表示,“在运行速度更快、成本更低的同时,其性能仍处于顶尖水平,超越了竞争对手的前沿模型。”

GPT-5.4延续了OpenAI在减少幻觉和事实错误方面的努力。该公司报告称,与GPT-5.2相比,新模型在单个陈述中出错的概率降低了33%,整体响应中出现错误的概率降低了18%。

作为此次发布的一部分,OpenAI 重新设计了 GPT-5.4 API 处理工具调用的方式,引入了一个名为“工具搜索”(Tool Search)的新系统。此前,系统提示必须预先定义所有可用工具——随着工具库的扩展,这一过程会消耗大量令牌。新系统允许模型按需检索工具定义,在工具众多的环境中,这使得请求处理更快且更具成本效益。

OpenAI 还新增了一项安全评估机制,用于评估其模型的“思维链”(即在多步骤任务中揭示模型推理过程的实时注释)。AI 安全研究人员长期以来一直担心,推理模型可能会歪曲其思维链,而测试证实,在某些条件下确实可能发生这种情况。

OpenAI的新评估表明,在GPT-5.4的Thinking版本中,这种欺骗行为发生的概率较低,"这表明该模型缺乏隐藏其推理过程的能力,且CoT监控仍是一种有效的安全工具。"

相关文章
萨提亚·纳德拉准备利用与OpenAI的新合作关系 萨提亚·纳德拉准备利用与OpenAI的新合作关系 周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图 OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图 正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI 格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI 2017年8月下旬,OpenAI(当时还是一家小型非营利研究实验室)的核心成员召开会议,商讨如何成立一家营利性实体,以实现技术的商业化,并筹集实现通用人工智能(AGI)所需的资金。埃隆·马斯克要求全面掌控公司,并刚刚向每位联合创始人赠送了一辆特斯拉Model 3。首席技术官格雷格·布罗克曼表示,他认为这是马斯克试图收买人心,当时马斯克和萨姆·阿尔特曼正就各自对公司未来愿景的支持展开角逐。 Open
相关专题推荐
动画创作 专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像
专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具,能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项,找到最适合你的创作工具,今天就在XIX.AI上将你的故事变为现实吧。

10 个工具
xix.ai
漫画创作 漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩
漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩

立即访问 XIX.AI,探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案,这些工具能以零一致性错误的方式应用平涂色彩,从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜,找到最适合您的工具。立即开启您的 AI 优势。

10 个工具
xix.ai
写作 顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷
顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷

探索2026年最优秀的AI人物设定生成工具,助您塑造鲜活立体的角色。XIX.AI精心筛选的这份清单汇集了广受好评、颠覆传统的工具,能够生成具有内在逻辑的动机和致命缺陷。通过实际测试对比免费与付费选项。立即释放您的叙事潜能。

10 个工具
xix.ai
商业 顶级 AI 定价优化软件:追踪竞争对手并自动调整店铺价格
顶级 AI 定价优化软件:追踪竞争对手并自动调整店铺价格

在 XIX.AI 上探索 2026 年最佳 AI 定价优化软件。我们精心挑选的清单汇集了备受好评、具有颠覆性意义的工具,这些工具不仅能追踪竞争对手,还能自动调整您的店铺价格,从而实现利润最大化。通过实际测试对比免费与付费选项。立即掌握您的定价优势。

10 个工具
xix.ai
代码 最佳 AI 代码审查工具:自动确保代码符合规范,并重构遗留代码库文件
最佳 AI 代码审查工具:自动确保代码符合规范,并重构遗留代码库文件

在 XIX.AI 上探索 2026 年最佳 AI 代码审查工具。我们的精选列表汇集了备受好评、具有颠覆性的工具,可自动确保代码规范并重构遗留代码库文件。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即开启您的 AI 优势。

10 个工具
xix.ai
文字转语音 专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率
专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率

探索2026年最新精选的高评分AI语音合成(TTS)应用,专为阅读障碍者提供支持。我们的专家评级对比了免费与付费工具,重点介绍了能够提升阅读效率和学习效果的强大功能。探索这些必试的、具有革命性意义的解决方案,释放学生的潜能。立即访问XIX.AI,开启您的探索之旅。

10 个工具
xix.ai
评论 (0)
0/500
OR