选项
首页
新闻
OpenAI发布高级AI推理模型,o3和o4-mini

OpenAI发布高级AI推理模型,o3和o4-mini

2025-07-25
53

OpenAI发布高级AI推理模型,o3和o4-mini

OpenAI周三推出o3和o4-mini,新AI模型设计为在回答前暂停并分析问题。

OpenAI称o3是其迄今最先进的推理模型,在数学、编码、推理、科学和视觉理解测试中超越先前模型。同时,o4-mini平衡了成本、速度和性能,是开发者构建AI驱动应用的优选。

与早期模型不同,o3和o4-mini利用ChatGPT工具,如网页浏览、Python代码执行、图像处理和图像生成。从今天起,这些模型及o4-mini-high(额外耗时以提升答案准确性)对OpenAI的Pro、Plus和Team计划订阅者开放。

这些模型是OpenAI在全球AI竞赛中超越Google、Meta、xAI、Anthropic和DeepSeek等对手的举措。尽管OpenAI以o1开创AI推理,但竞争对手随后发布了相当或更优的模型,使推理模型成为AI实验室的关键焦点。

最初,o3未计划用于ChatGPT发布。OpenAI CEO Sam Altman二月暗示专注于使用o3技术的更高级替代方案。然而,竞争压力可能促使OpenAI推出它。

OpenAI报告o3在SWE-bench验证(无自定义脚手架)中表现顶尖,编码任务得分69.1%。O4-mini得分68.1%,o3-mini得分49.3%,相比Claude 3.7 Sonnet的62.3%。

OpenAI称o3和o4-mini是其首批有效处理图像的模型。用户可上传白板草图或PDF图表等图像,模型在推理过程中分析它们,能处理模糊或低质量图像,并执行缩放或旋转等任务。

除图像外,o3和o4-mini通过ChatGPT的Canvas功能在浏览器中执行Python代码,并为实时事件查询搜索网络。

所有三款模型—o3、o4-mini和o4-mini-high—均可通过OpenAI的Chat Completions API和Responses API访问,开发者可将其集成到应用中,采用基于使用的定价。

OpenAI为o3定价为每百万输入令牌10美元(约75万字),输出令牌每百万40美元。O4-mini与o3-mini定价相同,每百万输入令牌1.10美元,输出令牌每百万4.40美元。

未来几周,OpenAI计划推出o3-pro,o3的高算力版本,仅限ChatGPT Pro订阅者。

CEO Sam Altman表示,o3和o4-mini可能是OpenAI在ChatGPT中推出GPT-5前最后的独立推理模型,GPT-5将整合传统和推理模型功能。

相关文章
美国参议院在争议中将人工智能暂停令从预算法案中删除 美国参议院在争议中将人工智能暂停令从预算法案中删除 参议院以压倒性多数废除人工智能监管禁令在两党罕见的团结一致中,美国立法者周二几乎一致投票通过,取消了上届政府最初通过的具有里程碑意义的立法中长达十年之久的禁止州一级人工智能监管的规定。在对快速发展的人工智能行业中的创新与消费者保护之间的平衡问题进行激烈辩论之后,以 99-1 的票数通过了这一决定性的投票。行业领袖与消费者拥护者的较量由参议员特德-克鲁兹(Ted Cruz,R-TX)倡导的
OpenAI 发布两款先进的开源权重 AI 模型 OpenAI 发布两款先进的开源权重 AI 模型 OpenAI 在周二宣布推出两款开源权重 AI 推理模型,其性能可与 o 系列媲美。两款模型均可在 Hugging Face 上免费下载,OpenAI 宣称它们在多个开源模型基准测试中表现“顶尖”。模型提供两种变体:功能强大的 gpt-oss-120b,可在一块 Nvidia GPU 上运行;轻量级 gpt-oss-20b,设计为可在配备 16GB 内存的普通笔记本电脑上运行。此次发布是 Open
字节跳动发布Seed-Thinking-v1.5 AI模型以增强推理能力 字节跳动发布Seed-Thinking-v1.5 AI模型以增强推理能力 高级推理AI的竞赛始于2024年9月OpenAI的o1模型,随着2025年1月DeepSeek的R1发布而加速。主要AI开发者现正竞相打造更快、更具成本效益的推理AI模型,通过链式思考过程提供精确、深思熟虑的回答,确保回答前的准确性。字节跳动,TikTok的母公司,推出了Seed-Thinking-v1.5,这是一个在技术论文中概述的新大型语言模型(LLM),旨在提升STEM和通用领域的推理能力。
评论 (3)
0/200
NicholasWalker
NicholasWalker 2025-09-05 02:30:32

OpenAI又出新模型了,但這次的o3和o4-mini真的能突破現有的推理限制嗎?還是只是換個名字的老套路?🤔 每次聽到『最先進』這種標語就讓人半信半疑...

TimothyEvans
TimothyEvans 2025-08-25 13:33:49

Wow, OpenAI's o3 sounds like a game-changer! Pausing to think before answering? That's some next-level AI. Can't wait to see how it stacks up against other models in real-world tasks! 🤯

TimothyHill
TimothyHill 2025-08-21 23:01:16

The new o3 model sounds like a game-changer! Pausing to think before answering? That's like giving AI a moment to sip coffee and ponder. Can't wait to see how it tackles complex questions! 😎

返回顶部
OR