选项
首页
新闻
Luma AI 发布了 Uni-1 自回归模型,该模型可同时生成文本和像素

Luma AI 发布了 Uni-1 自回归模型,该模型可同时生成文本和像素

2026-06-05
10

Luma Labs 于 3 月 23 日发布了其图像生成模型 Uni-1,这是该公司首个基于统一智能架构(Unified Intelligence)构建的公开可用模型。目前,官方网站已开放免费试用,API 定价已公布,企业级访问渠道也将逐步推出。

QQ_1774317385820.png

架构转型:从扩散模型转向自回归模型

Uni-1摒弃了主流的扩散模型方案,转而采用仅含解码器的自回归Transformer架构。该模型将文本和图像令牌以交替序列的形式排列在单一序列中,仅需一次前向传播即可完成推理和像素生成。

Luma首席执行官Amit Jain解释称,传统方案通常先使用语言模型进行规划,再交由扩散模型进行生成,导致两个阶段之间存在信息丢失。Uni-1的设计旨在消除这一缺口。

Jain 此前曾在苹果公司任职,并参与了 Vision Pro 的工程开发。

功能:参考图像控制与跨风格生成

Uni-1支持基于一张或多张参考图像进行图像生成,能够保留主体的身份、姿态和构图。官方测试显示,在多参考图像模式下,该模型在处理角色一致性和肖像控制方面表现稳定。

该模型宣称支持76种视觉风格,涵盖写实摄影、漫画及浮世绘等类别。

在演示中,输入“绘制金门大桥的信息图”,模型会自动规划布局,生成桥梁结构图,并标注“1711米”等数据,其内部推理过程可实时可见。

基准测试:在空间推理和参考生成方面处于领先地位

QQ_1774317334856.png

Luma发布的数据显示,Uni-1在RISEBench推理基准测试中获得0.51分,高于Google Nano Banana 2的0.50分和OpenAI GPT Image 1.5的0.46分。 其空间推理得分达到0.58,逻辑推理得分0.32,约为GPT Image的两倍。

在 ODinW-13 物体检测基准测试中,Uni-1 取得了 46.2 mAP 的成绩,接近 Google Gemini 3 Pro 的 46.3。

在人类偏好Elo排名中,Uni-1在总体偏好、风格与编辑以及参考生成方面位列第一,在文本到图像生成方面位列第二。

定价

API 收费基于令牌:输入文本每百万令牌 0.50 美元,输入图像每百万令牌 1.20 美元,输出文本和思维链每百万令牌 3.00 美元,输出图像每百万令牌 45.45 美元。

按每张图片计算:文本转图像(2048px)约需 0.0909 美元,使用单张参考图像进行编辑约需 0.0933 美元,使用八张参考图像约需 0.1101 美元。

VentureBeat报道称,在2K分辨率的企业场景中,Uni-1的成本比Google Nano Banana 2低10%至30%。

背景

Luma Labs此前专注于视频生成产品,如Dream Machine(Ray3系列)。3月5日,该公司发布了同样基于统一智能架构的创意代理平台Luma Agents。Uni-1是该架构在静态图像产品中的首次应用。

发布数小时内,X平台上的相关帖子浏览量已突破230万次。Luma表示视频和音频版本将陆续推出,但具体时间表尚未披露。

体验地址:lumalabs.ai/uni-1

相关文章
AI浏览器Comet正式上线,全面支持iPad多任务处理 AI浏览器Comet正式上线,全面支持iPad多任务处理 Perplexity 旗下的人工智能浏览器 Comet 已正式推出 iPad 版本,现已全面兼容 iPadOS。此次更新引入了多窗口浏览、多任务处理支持,并与 OpenAI 和 Anthropic 等领先的人工智能模型深度集成,为用户带来更智能的网络体验。Comet 浏览器拓宽了用户探索网络和与 AI 聊天机器人互动的方式,提供便捷访问 OpenAI 和 Anthropic 等顶级 AI 模型的通
Trace筹集了300万美元,用于解决企业采用AI智能助手时所遇到的各种障碍。 Trace筹集了300万美元,用于解决企业采用AI智能助手时所遇到的各种障碍。 尽管人工智能代理具有巨大潜力,但它们在企业中仍难以取得实质性进展。一家新兴的初创企业认为,根本问题在于缺乏上下文信息。Trace是一家专注于工作流程协作的初创企业,它作为Y Combinator 2025年夏季培训项目的一部分诞生,旨在弥补这一空白。该公司能够梳理复杂的企业环境和业务流程,为人工智能代理提供所需的上下文信息,从而帮助它们快速发展。“OpenAI和Anthropic培养出了非常优秀的人工智能实习生,企业完全可以利用这些资源,”Trace的首席执行官Tim Cherkasov解释
Google I/O 2026 发布 Gmail 收件箱语音交互功能 Google I/O 2026 发布 Gmail 收件箱语音交互功能 谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
相关专题推荐
代码 最佳 AI 代码审查工具:自动确保代码符合规范,并重构遗留代码库文件
最佳 AI 代码审查工具:自动确保代码符合规范,并重构遗留代码库文件

在 XIX.AI 上探索 2026 年最佳 AI 代码审查工具。我们的精选列表汇集了备受好评、具有颠覆性的工具,可自动确保代码规范并重构遗留代码库文件。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即开启您的 AI 优势。

10 个工具
xix.ai
文字转语音 专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率
专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率

探索2026年最新精选的高评分AI语音合成(TTS)应用,专为阅读障碍者提供支持。我们的专家评级对比了免费与付费工具,重点介绍了能够提升阅读效率和学习效果的强大功能。探索这些必试的、具有革命性意义的解决方案,释放学生的潜能。立即访问XIX.AI,开启您的探索之旅。

10 个工具
xix.ai
漫画创作 少年漫画顶级AI生成器:打造高能动作场面与特效
少年漫画顶级AI生成器:打造高能动作场面与特效

在 XIX.AI 探索 2026 年最优秀的少年漫画 AI 生成工具。我们精心筛选的这份高评分清单汇集了强大的工具,助您创作充满张力的动作场面和动态能量特效。通过实际测试对比免费与付费选项。释放您的创作潜能,立即开始创作史诗级漫画吧!

15 个工具
xix.ai
商业 最佳 AI 费用追踪工具:扫描收据并自动分类企业开支
最佳 AI 费用追踪工具:扫描收据并自动分类企业开支

2026年最新最佳AI报销管理工具:广受好评的解决方案,可自动扫描收据并分类企业支出。探索这些功能强大、颠覆传统的解决方案,助您轻松管理报销、精准追踪财务并简化合规流程。我们精心整理并每周更新的免费与付费选项对比指南,助您找到最适合的工具。通过XIX.AI的专家精选,释放您的AI优势。

10 个工具
xix.ai
商业 最佳人工智能招聘工具:筛选简历并自动安排候选人面试
最佳人工智能招聘工具:筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案,可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名,对比免费与付费选项。立即找到最适合您的招聘助手,优化您的招聘流程!

10 个工具
xix.ai
生产率 AI个人健康与专注力教练:缓解倦怠,提升精神能量
AI个人健康与专注力教练:缓解倦怠,提升精神能量

立即访问 XIX.AI,探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具,助您缓解倦怠、提升精神能量。通过真实案例分析,对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具
xix.ai
评论 (0)
0/500
OR