选项
首页
新闻
ChatGPT的Images 2.0模型在文本生成方面表现出色

ChatGPT的Images 2.0模型在文本生成方面表现出色

2026-05-17
51

就在几年前,区分人工制作的图像和AI生成的图像还相对容易。那时,如果让图像模型生成一份墨西哥餐厅的菜单,结果往往是些怪诞的、虚构的菜品,比如“enchuita”、“churiros”、“burrto”或“margartas”。

如今,当我向全新的ChatGPT Images 2.0模型请求一份墨西哥菜单时,它生成的内容完全可以直接用于真实餐厅,顾客恐怕也难以察觉任何破绽。(尽管一份售价13.50美元的酸橘汁腌鱼,或许仍会让人对鱼的品质产生疑问。)

ChatGPT 的新版 Images 2.0 模型在生成文本方面表现得相当出色

图片来源:ChatGPT Images 2.0

作为对比,这是两年前我从 DALL-E 3 获得的结果。(当时 ChatGPT 还未具备图像生成能力):

ChatGPT 的新版 Images 2.0 模型在生成文本方面表现得相当出色

图片来源:Microsoft Designer (DALL-E 3)

从历史上看,AI图像生成器在拼写方面一直存在显著困难。这主要是因为它们通常依赖扩散模型,该模型通过随机噪声来重建图像。

“扩散模型……是在重构给定的输入,”Lesan AI创始人兼首席执行官Asmelash Teka Hadgu在2024年向TechCrunch解释道,“我们可以将图像上的文字视为一个非常微小的组成部分,因此图像生成器会优先学习占据更多像素的视觉模式。”

此后,研究人员开始探索其他图像生成方法,例如自回归模型。这些模型通过逐步预测图像应呈现的样貌,其运作方式更接近大型语言模型(LLMs)。

遗憾的是,OpenAI在本周的新闻发布会上拒绝回答关于ChatGPT Images 2.0具体模型架构的问题。

不过,该公司明确表示,新模型具备“思考能力”。这使其能够搜索网络、根据单一提示生成多张图片,并审查自身生成的内容。这些功能使Images 2.0能够制作多维度的营销材料,以及多格漫画。

OpenAI还表示,Images 2.0在渲染非拉丁文字方面表现更佳,包括日语、韩语、印地语和孟加拉语。该模型的知识库更新截止至2025年12月,这可能会影响其生成与近期事件相关图像时的准确性。

OpenAI在新闻稿中指出:“Images 2.0在图像创作方面实现了前所未有的细节表现力和准确性。它不仅能构思更复杂的场景,还能有效实现这些构想。它能精准遵循指令,保留指定细节,并渲染出其他图像模型常难以处理的精细元素——例如小字、图标、UI组件、复杂构图以及细微的风格差异——且分辨率最高可达2K。”

这些先进功能意味着图像生成并非像向 ChatGPT 提问那样即时。不过,生成诸如多格漫画等复杂内容,仍只需几分钟。

从本周二起,所有 ChatGPT 和 Codex 用户均可使用 Images 2.0,付费订阅用户可生成更高级的输出内容。该公司还将发布 gpt-image-2 API,其定价将根据所需的输出质量和分辨率而定。

相关文章
萨提亚·纳德拉准备利用与OpenAI的新合作关系 萨提亚·纳德拉准备利用与OpenAI的新合作关系 周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图 OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图 正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI 格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI 2017年8月下旬,OpenAI(当时还是一家小型非营利研究实验室)的核心成员召开会议,商讨如何成立一家营利性实体,以实现技术的商业化,并筹集实现通用人工智能(AGI)所需的资金。埃隆·马斯克要求全面掌控公司,并刚刚向每位联合创始人赠送了一辆特斯拉Model 3。首席技术官格雷格·布罗克曼表示,他认为这是马斯克试图收买人心,当时马斯克和萨姆·阿尔特曼正就各自对公司未来愿景的支持展开角逐。 Open
相关专题推荐
文字转语音 专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率
专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率

探索2026年最新精选的高评分AI语音合成(TTS)应用,专为阅读障碍者提供支持。我们的专家评级对比了免费与付费工具,重点介绍了能够提升阅读效率和学习效果的强大功能。探索这些必试的、具有革命性意义的解决方案,释放学生的潜能。立即访问XIX.AI,开启您的探索之旅。

10 个工具
xix.ai
漫画创作 少年漫画顶级AI生成器:打造高能动作场面与特效
少年漫画顶级AI生成器:打造高能动作场面与特效

在 XIX.AI 探索 2026 年最优秀的少年漫画 AI 生成工具。我们精心筛选的这份高评分清单汇集了强大的工具,助您创作充满张力的动作场面和动态能量特效。通过实际测试对比免费与付费选项。释放您的创作潜能,立即开始创作史诗级漫画吧!

15 个工具
xix.ai
商业 最佳 AI 费用追踪工具:扫描收据并自动分类企业开支
最佳 AI 费用追踪工具:扫描收据并自动分类企业开支

2026年最新最佳AI报销管理工具:广受好评的解决方案,可自动扫描收据并分类企业支出。探索这些功能强大、颠覆传统的解决方案,助您轻松管理报销、精准追踪财务并简化合规流程。我们精心整理并每周更新的免费与付费选项对比指南,助您找到最适合的工具。通过XIX.AI的专家精选,释放您的AI优势。

10 个工具
xix.ai
商业 最佳人工智能招聘工具:筛选简历并自动安排候选人面试
最佳人工智能招聘工具:筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案,可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名,对比免费与付费选项。立即找到最适合您的招聘助手,优化您的招聘流程!

10 个工具
xix.ai
生产率 AI个人健康与专注力教练:缓解倦怠,提升精神能量
AI个人健康与专注力教练:缓解倦怠,提升精神能量

立即访问 XIX.AI,探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具,助您缓解倦怠、提升精神能量。通过真实案例分析,对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具
xix.ai
聊天机器人 备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系
备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人,助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人,并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣,立即开始建立联系吧。

10 个工具
xix.ai
评论 (0)
0/500
OR