选项
首页
新闻
经过4个月的重新设计,GPT Image2的13人核心团队正式揭晓

经过4个月的重新设计,GPT Image2的13人核心团队正式揭晓

2026-05-20
34

最近,GPT Image2凭借其逼真得令人惊叹的图像生成能力在社交媒体上引发了轰动。随着该项目人气飙升,其背后那个低调的小团队也走入了公众视野。 据透露,核心团队仅由13人组成,他们仅用四个月时间就彻底重写了底层架构。虽然研究负责人陈博远尚未披露具体的技术细节,但他将这一新模型描述为“视觉领域的GPT”,这标志着通用能力方面取得了重大飞跃。

团队核心人物陈博远有着一段非凡的个人经历。攻读博士期间,他开创了“扩散强制(Diffusion Forcing)”等创新方法,并为指令微调技术做出了贡献,这些技术后来被谷歌的Gemini 2.0所采用。有趣的是,他最初参加高中科学夏令营时甚至还不懂Python。 加入OpenAI后,他不仅主导了GPT图像模型的全部训练工作,还担任Sora视频生成团队的核心成员。在一次演示中,他通过生成中文、韩文和孟加拉文排版完美的海报,展示了该模型先进的语言理解能力。

image.png

除了文本渲染,GPT Image2在理解世界知识和遵循复杂指令方面也达到了新的高度。该模块由中国科学技术大学的王建峰博士领导,致力于解决人工智能图像生成中一个长期存在的问题——例如旧模型总是默认将时钟画成10:10。新模型能够准确解读任何指定的时间以及复杂的空间布局。 王建峰博士指出,该模型正在有效缩小用户创意构想与最终生成结果之间的差距。

在生产力方面,浙江大学竹园学院的杨玉光展示了该工具能够将冗长的研究论文即时转换为高精度的PowerPoint演示文稿和信息图表。这一能力源于团队对多模态理解、专家混合(MoE)架构以及长上下文引导技术的深度融合。

从最初的DALL-E到如今的GPT Image2

相关文章
奔腾4的复兴:这款已有20年历史的CPU能够运行Meta Llama 3大型模型 奔腾4的复兴:这款已有20年历史的CPU能够运行Meta Llama 3大型模型 最近,YouTube技术频道Fully Buffered进行了一项令人印象深刻且极具挑战性的实验:他们成功地在2006年推出的Pentium 4 641处理器上运行了Meta最新的Llama 3.2 3B大型模型。这项测试迫使现代人工智能技术与二十年前的硬件设备进行了碰撞,不仅揭示了大语言模型的基本兼容性限制,还引发了众多观众的思考:在人工智能时代,摩尔定律是如何以这种不同寻常的方式实现跨代际应用的。硬件考古学:将2006年的组件推向极限为了完成这项测试,Fully Buffered团队重
杭州市上城区推出了浙江省首个基于AIGC技术的视听产业“黄金十项措施”,并设立了50亿规模的产业发展基金。 杭州市上城区推出了浙江省首个基于AIGC技术的视听产业“黄金十项措施”,并设立了50亿规模的产业发展基金。 16日,AIGC视听产业创新生态大会在杭州上城区举行。会议期间,该省推出了针对AIGC视听产业的的首项专项政策——“黄金十项措施”。这项政策涵盖了技术创新、成本降低、内容质量提升、人才培养以及全球发展等多个方面。这些政策提供了强有力的激励措施。对于技术创新领域,凡是专注于AIGC工具、AI虚拟拍摄和AI交互叙事系统的研究开发项目,均可获得最高300万元的补贴。而对于高质量的内容创作,那些在年内通过知名平台发布的AIGC视听作品,每部可获得最高30万元的奖励,每家企业的年度奖励总额上限为100万
北京工业大学就包括人工智能模型上下文协议在内的121项行业标准征求公众意见 北京工业大学就包括人工智能模型上下文协议在内的121项行业标准征求公众意见 中国工业和信息化部正式发布通知,征求公众对121项行业标准化的意见,其中包括“人工智能安全治理模型上下文协议的应用安全要求”。这一公告标志着中国在建立人工智能基础标准和安全监管框架方面取得了重要进展。此次公开征求意见的重点是针对该模型上下文协议的应用安全问题,旨在通过标准化的技术规范来解决多模态交互、长文本处理以及跨平台调用过程中出现的协议兼容性和数据安全方面的问题。
相关专题推荐
聊天机器人 使用这些角色扮演工具,创作属于你的AI爱情故事
使用这些角色扮演工具,创作属于你的AI爱情故事

探索2026年最新、最受好评的AI角色扮演工具,打造身临其境的叙事体验。XIX.AI精心整理的这份清单汇集了功能强大、颠覆传统的助手,助您释放创意叙事潜力,挖掘情感深度。通过实际测试对比免费与付费选项。立即开启您的独特旅程。

10 个工具
xix.ai
文字转语音 独立游戏开发者必备的顶级AI配音工具:为RPG和视觉小说节省配音时间
独立游戏开发者必备的顶级AI配音工具:为RPG和视觉小说节省配音时间

探索2026年最适合游戏开发者的AI配音工具!XIX.AI精心整理的这份清单汇集了广受好评、能彻底改变游戏开发格局的解决方案,助您在角色扮演游戏(RPG)和视觉小说的配音制作中节省时间和成本。了解免费与付费版本的对比分析、实际测试结果以及每周更新的排行榜。立即找到最适合您的配音工具吧!

10 个工具
xix.ai
教育与学习 最佳人工智能间隔重复学习工具:帮助医学生和法律专业学生优化学习计划
最佳人工智能间隔重复学习工具:帮助医学生和法律专业学生优化学习计划

探索由 XIX.AI 精心挑选的 2026 年最佳 AI 间隔重复学习工具。我们推荐的这些极具创新性的工具能帮助医学和法律专业的学生优化学习计划,从而提高知识记忆效果。通过真实案例测试和每周更新的排名信息,你可以了解免费选项与付费选项之间的差异。现在就开启你的学习优势吧!

10 个工具
xix.ai
视频创作 最适合剧本创作和视觉叙事的AI文本转视频平台
最适合剧本创作和视觉叙事的AI文本转视频平台

2026年最新最佳AI文字转视频平台:备受好评的剧本创作与视觉叙事工具。探索这些功能强大、颠覆传统的解决方案,将您的文字转化为引人入胜的视频。通过我们每周更新的排行榜和实际测试,对比免费与付费选项。找到最适合您的平台,激发创意,提升效率。立即访问XIX.AI,探索精心精选的优质平台。

10 个工具
xix.ai
聊天机器人 AI多智能体编排器:通过自然语言设计复杂的自动化工作流程
AI多智能体编排器:通过自然语言设计复杂的自动化工作流程

2026最新资讯:探索最优秀的人工智能多智能体协调工具,通过自然语言设计复杂的自动化工作流程。我们精心挑选的列表中包含了评分最高、功能强大的平台,这些平台能够实现无缝的任务自动化和智能化的流程管理。对比免费与付费选项,并了解实际应用中的效果。借助XIX.AI每周更新的专家排名,让你在人工智能领域取得领先优势。

10 个工具
xix.ai
图像编辑 最佳AI降噪软件:消除低光夜间摄影中的颗粒感和伪影
最佳AI降噪软件:消除低光夜间摄影中的颗粒感和伪影

探索2026年最适合低光夜间摄影的AI降噪软件。我们精心挑选了最受欢迎的免费及付费工具,通过实际测试并每周更新排名来进行对比。轻松去除图像中的颗粒感与瑕疵,在XIX.AI上释放你的AI潜力。

10 个工具
xix.ai
评论 (0)
0/500
OR