Hogar
Luma AI presenta el modelo autorregresivo Uni-1, capaz de generar texto y píxeles al mismo tiempo
Luma Labs lanzó el 23 de marzo su modelo de generación de imágenes Uni-1, el primer modelo de la empresa disponible para el público general y basado en la arquitectura Unified Intelligence. Ya está disponible el acceso a la prueba gratuita en la página web oficial; además, se han anunciado las tarifas de la API y se están implementando progresivamente los canales de acceso para empresas.

Cambio de arquitectura: de los modelos de difusión a los autorregresivos
Uni-1 se aleja del enfoque predominante de los modelos de difusión y opta, en su lugar, por un Transformer autorregresivo que utiliza únicamente un decodificador. Organiza los tokens de texto e imagen en una secuencia alterna dentro de una única secuencia, completando la inferencia y la generación de píxeles en una sola pasada hacia adelante.
El director ejecutivo de Luma, Amit Jain, explicó que las soluciones tradicionales suelen utilizar primero un modelo de lenguaje para la planificación y luego pasan a un modelo de difusión para la generación, lo que provoca una pérdida de información entre ambas etapas. El diseño de Uni-1 tiene como objetivo eliminar esta brecha.
Jain trabajó anteriormente en Apple y contribuyó al desarrollo de Vision Pro.
Capacidades: control de imágenes de referencia y generación entre estilos
Uni-1 admite la generación de imágenes guiadas por una o más imágenes de referencia, conservando la identidad, la postura y la composición del sujeto. Las pruebas oficiales muestran un rendimiento estable en el manejo de la coherencia de los personajes y el control de los retratos en el modo de imágenes de referencia múltiple.
El modelo afirma ser compatible con 76 estilos visuales, que abarcan categorías como la fotografía realista, los cómics y el ukiyo-e.
En una demostración, al introducir «Dibuja una infografía del puente Golden Gate», el modelo planificó automáticamente el diseño, generó un diagrama de la estructura del puente y anotó datos como «1711 metros», con el proceso de razonamiento interno visible en tiempo real.
Pruebas de rendimiento: líder en razonamiento espacial y generación de referencias

Los datos publicados por Luma muestran que Uni-1 obtuvo una puntuación de 0,51 en la prueba de rendimiento de razonamiento RISEBench, superior a la de Google Nano Banana 2 (0,50) y a la de OpenAI GPT Image 1.5 (0,46). Su puntuación en razonamiento espacial alcanzó 0,58, y en razonamiento lógico 0,32, aproximadamente el doble que la de GPT Image.
En la prueba de detección de objetos ODinW-13, Uni-1 alcanzó 46,2 mAP, cerca del 46,3 de Google Gemini 3 Pro.
En las clasificaciones Elo de preferencias humanas, Uni-1 ocupó el primer puesto en preferencia general, estilo y edición, y generación de referencias, y el segundo en generación de texto a imagen.
Precios
Las tarifas de la API se basan en tokens: 0,50 $ por millón de tokens para el texto de entrada, 1,20 $ por millón de tokens para las imágenes de entrada, 3,00 $ por millón de tokens para el texto de salida y la cadena de pensamiento, y 45,45 $ por millón de tokens para las imágenes de salida.
Convertido a una base por imagen: la conversión de texto a imagen (2048 píxeles) cuesta aproximadamente 0,0909 $, la edición con una sola imagen de referencia alrededor de 0,0933 $ y con ocho imágenes de referencia unos 0,1101 $.
VentureBeat informó de que, en entornos empresariales con resolución 2K, Uni-1 cuesta entre un 10 % y un 30 % menos que Google Nano Banana 2.
Antecedentes
Luma Labs se centraba anteriormente en productos de generación de vídeo como Dream Machine (serie Ray3). El 5 de marzo, la empresa lanzó la plataforma de agentes creativos Luma Agents, también basada en la arquitectura Unified Intelligence. Uni-1 es la primera aplicación de esta arquitectura en un producto de imágenes estáticas.
A las pocas horas del lanzamiento, las publicaciones relacionadas en la plataforma X acumularon más de 2,3 millones de visitas. Luma afirmó que le seguirán versiones de vídeo y audio, aunque no se han revelado plazos concretos.
Pruébalo en: lumalabs.ai/uni-1
Artículo relacionado
Bain prevé un mercado de SaaS de 100 000 millones de dólares en el ámbito de la automatización basada en IA agentiva
Bain & Company ha estimado que en Estados Unidos existe un mercado de 100 000 millones de dólares para las empresas de SaaS que aprovechan la IA agentiva. La consultora afirma que este mercado surge d
La política de búsqueda con IA obligatoria provoca una fuga de usuarios, mientras que DuckDuckGo registra un aumento de usuarios
Tras el anuncio realizado por Google en la conferencia I/O de 2026 sobre una renovación completa de su motor de búsqueda basada en la IA, muchos usuarios comenzaron a buscar alternativas más controlab
Xiaohongshu se reestructura: Conan es nombrado presidente y crea el departamento principal de IA «Dots» y la división internacional «Rednote»
El 30 de abril, Xiaohongshu envió una nota interna a todos los empleados en la que anunciaba el lanzamiento de una nueva reestructuración organizativa. El núcleo de este cambio consiste en integrar pl
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
Luma Labs lanzó el 23 de marzo su modelo de generación de imágenes Uni-1, el primer modelo de la empresa disponible para el público general y basado en la arquitectura Unified Intelligence. Ya está disponible el acceso a la prueba gratuita en la página web oficial; además, se han anunciado las tarifas de la API y se están implementando progresivamente los canales de acceso para empresas.

Cambio de arquitectura: de los modelos de difusión a los autorregresivos
Uni-1 se aleja del enfoque predominante de los modelos de difusión y opta, en su lugar, por un Transformer autorregresivo que utiliza únicamente un decodificador. Organiza los tokens de texto e imagen en una secuencia alterna dentro de una única secuencia, completando la inferencia y la generación de píxeles en una sola pasada hacia adelante.
El director ejecutivo de Luma, Amit Jain, explicó que las soluciones tradicionales suelen utilizar primero un modelo de lenguaje para la planificación y luego pasan a un modelo de difusión para la generación, lo que provoca una pérdida de información entre ambas etapas. El diseño de Uni-1 tiene como objetivo eliminar esta brecha.
Jain trabajó anteriormente en Apple y contribuyó al desarrollo de Vision Pro.
Capacidades: control de imágenes de referencia y generación entre estilos
Uni-1 admite la generación de imágenes guiadas por una o más imágenes de referencia, conservando la identidad, la postura y la composición del sujeto. Las pruebas oficiales muestran un rendimiento estable en el manejo de la coherencia de los personajes y el control de los retratos en el modo de imágenes de referencia múltiple.
El modelo afirma ser compatible con 76 estilos visuales, que abarcan categorías como la fotografía realista, los cómics y el ukiyo-e.
En una demostración, al introducir «Dibuja una infografía del puente Golden Gate», el modelo planificó automáticamente el diseño, generó un diagrama de la estructura del puente y anotó datos como «1711 metros», con el proceso de razonamiento interno visible en tiempo real.
Pruebas de rendimiento: líder en razonamiento espacial y generación de referencias

Los datos publicados por Luma muestran que Uni-1 obtuvo una puntuación de 0,51 en la prueba de rendimiento de razonamiento RISEBench, superior a la de Google Nano Banana 2 (0,50) y a la de OpenAI GPT Image 1.5 (0,46). Su puntuación en razonamiento espacial alcanzó 0,58, y en razonamiento lógico 0,32, aproximadamente el doble que la de GPT Image.
En la prueba de detección de objetos ODinW-13, Uni-1 alcanzó 46,2 mAP, cerca del 46,3 de Google Gemini 3 Pro.
En las clasificaciones Elo de preferencias humanas, Uni-1 ocupó el primer puesto en preferencia general, estilo y edición, y generación de referencias, y el segundo en generación de texto a imagen.
Precios
Las tarifas de la API se basan en tokens: 0,50 $ por millón de tokens para el texto de entrada, 1,20 $ por millón de tokens para las imágenes de entrada, 3,00 $ por millón de tokens para el texto de salida y la cadena de pensamiento, y 45,45 $ por millón de tokens para las imágenes de salida.
Convertido a una base por imagen: la conversión de texto a imagen (2048 píxeles) cuesta aproximadamente 0,0909 $, la edición con una sola imagen de referencia alrededor de 0,0933 $ y con ocho imágenes de referencia unos 0,1101 $.
VentureBeat informó de que, en entornos empresariales con resolución 2K, Uni-1 cuesta entre un 10 % y un 30 % menos que Google Nano Banana 2.
Antecedentes
Luma Labs se centraba anteriormente en productos de generación de vídeo como Dream Machine (serie Ray3). El 5 de marzo, la empresa lanzó la plataforma de agentes creativos Luma Agents, también basada en la arquitectura Unified Intelligence. Uni-1 es la primera aplicación de esta arquitectura en un producto de imágenes estáticas.
A las pocas horas del lanzamiento, las publicaciones relacionadas en la plataforma X acumularon más de 2,3 millones de visitas. Luma afirmó que le seguirán versiones de vídeo y audio, aunque no se han revelado plazos concretos.
Pruébalo en: lumalabs.ai/uni-1
La política de búsqueda con IA obligatoria provoca una fuga de usuarios, mientras que DuckDuckGo registra un aumento de usuarios
Tras el anuncio realizado por Google en la conferencia I/O de 2026 sobre una renovación completa de su motor de búsqueda basada en la IA, muchos usuarios comenzaron a buscar alternativas más controlab
Xiaohongshu se reestructura: Conan es nombrado presidente y crea el departamento principal de IA «Dots» y la división internacional «Rednote»
El 30 de abril, Xiaohongshu envió una nota interna a todos los empleados en la que anunciaba el lanzamiento de una nueva reestructuración organizativa. El núcleo de este cambio consiste en integrar pl











