Lar
A Luma AI apresenta o modelo autorregressivo Uni-1, capaz de gerar texto e pixels simultaneamente
A Luma Labs lançou seu modelo de geração de imagens Uni-1 em 23 de março, marcando o primeiro modelo da empresa disponível ao público desenvolvido com base na arquitetura Unified Intelligence. O acesso à versão de teste gratuita já está disponível no site oficial, com os preços da API anunciados e os canais de acesso corporativo sendo implementados gradualmente.

Mudança de arquitetura: de modelos de difusão para autorregressivos
O Uni-1 se afasta da abordagem predominante dos modelos de difusão, optando, em vez disso, por um Transformer autorregressivo apenas com decodificador. Ele organiza tokens de texto e imagem em uma sequência alternada dentro de uma única sequência, completando a inferência e a geração de pixels em uma única passagem.
O CEO da Luma, Amit Jain, explicou que as soluções tradicionais normalmente usam primeiro um modelo de linguagem para o planejamento e, em seguida, passam para um modelo de difusão para a geração, causando perda de informação entre as duas etapas. O design do Uni-1 visa eliminar essa lacuna.
Jain trabalhou anteriormente na Apple e contribuiu para a engenharia do Vision Pro.
Recursos: Controle de Imagem de Referência e Geração entre Estilos
O Uni-1 suporta a geração de imagens guiada por uma ou mais imagens de referência, preservando a identidade, a postura e a composição do sujeito. Testes oficiais mostram desempenho estável no tratamento da consistência de personagens e no controle de retratos no modo de imagem com múltiplas referências.
O modelo afirma oferecer suporte a 76 estilos visuais, abrangendo categorias como fotografia realista, quadrinhos e ukiyo-e.
Em uma demonstração, a entrada “Desenhe um infográfico da Ponte Golden Gate” levou o modelo a planejar automaticamente o layout, gerar um diagrama da estrutura da ponte e anotar dados como “1.711 metros”, com o processo de raciocínio interno visível em tempo real.
Benchmarks: Liderança em raciocínio espacial e geração de referências

Dados publicados pela Luma mostram que o Uni-1 obteve 0,51 no benchmark de raciocínio RISEBench, pontuação superior aos 0,50 do Google Nano Banana 2 e aos 0,46 do OpenAI GPT Image 1.5. Sua pontuação em raciocínio espacial atingiu 0,58, e em raciocínio lógico, 0,32, aproximadamente o dobro da pontuação do GPT Image.
No benchmark de detecção de objetos ODinW-13, o Uni-1 alcançou 46,2 mAP, próximo dos 46,3 do Google Gemini 3 Pro.
No ranking Elo de preferência humana, o Uni-1 ficou em primeiro lugar em preferência geral, estilo e edição, e geração de referência, e em segundo lugar na geração de texto para imagem.
Preços
As cobranças da API são baseadas em tokens: US$ 0,50 por milhão de tokens para texto de entrada, US$ 1,20 por milhão de tokens para imagens de entrada, US$ 3,00 por milhão de tokens para texto de saída e cadeia de pensamentos, e US$ 45,45 por milhão de tokens para imagens de saída.
Convertido para uma base por imagem: texto para imagem (2048px) custa aproximadamente US$ 0,0909, edição com uma única imagem de referência cerca de US$ 0,0933 e oito imagens de referência cerca de US$ 0,1101.
A VentureBeat informou que, em cenários empresariais com resolução de 2K, o Uni-1 custa de 10% a 30% menos do que o Google Nano Banana 2.
Contexto
A Luma Labs anteriormente se concentrava em produtos de geração de vídeo, como o Dream Machine (série Ray3). Em 5 de março, a empresa lançou a plataforma de agentes criativos Luma Agents, também baseada na arquitetura Unified Intelligence. O Uni-1 é a primeira aplicação dessa arquitetura em um produto de imagem estática.
Poucas horas após o lançamento, publicações relacionadas na plataforma X alcançaram mais de 2,3 milhões de visualizações. A Luma afirmou que versões em vídeo e áudio serão lançadas em breve, embora cronogramas específicos não tenham sido divulgados.
Experimente em: lumalabs.ai/uni-1
Artigo relacionado
A Bain prevê um mercado de SaaS de US$ 100 bilhões na automação por IA agênica
A Bain & Company estimou um mercado de US$ 100 bilhões nos EUA para empresas de SaaS que utilizam IA agentiva. A empresa afirmou que esse mercado decorre da automação de tarefas de coordenação dentro
Política obrigatória de pesquisa com IA impulsiona êxodo; DuckDuckGo registra aumento no número de usuários
Após o anúncio feito pela Google na conferência I/O de 2026 sobre uma reformulação completa do seu mecanismo de busca com IA, muitos usuários começaram a procurar alternativas mais controláveis, já qu
Xiaohongshu passa por reestruturação: Conan é nomeado presidente, cria o Departamento de IA e a Divisão Internacional Rednote
Em 30 de abril, a Xiaohongshu enviou um memorando interno a todos os funcionários anunciando o lançamento de uma nova reestruturação organizacional. O cerne dessa mudança envolve a integração total de
Recomendações de tópicos especiais relacionados
Comentários (0)
A Luma Labs lançou seu modelo de geração de imagens Uni-1 em 23 de março, marcando o primeiro modelo da empresa disponível ao público desenvolvido com base na arquitetura Unified Intelligence. O acesso à versão de teste gratuita já está disponível no site oficial, com os preços da API anunciados e os canais de acesso corporativo sendo implementados gradualmente.

Mudança de arquitetura: de modelos de difusão para autorregressivos
O Uni-1 se afasta da abordagem predominante dos modelos de difusão, optando, em vez disso, por um Transformer autorregressivo apenas com decodificador. Ele organiza tokens de texto e imagem em uma sequência alternada dentro de uma única sequência, completando a inferência e a geração de pixels em uma única passagem.
O CEO da Luma, Amit Jain, explicou que as soluções tradicionais normalmente usam primeiro um modelo de linguagem para o planejamento e, em seguida, passam para um modelo de difusão para a geração, causando perda de informação entre as duas etapas. O design do Uni-1 visa eliminar essa lacuna.
Jain trabalhou anteriormente na Apple e contribuiu para a engenharia do Vision Pro.
Recursos: Controle de Imagem de Referência e Geração entre Estilos
O Uni-1 suporta a geração de imagens guiada por uma ou mais imagens de referência, preservando a identidade, a postura e a composição do sujeito. Testes oficiais mostram desempenho estável no tratamento da consistência de personagens e no controle de retratos no modo de imagem com múltiplas referências.
O modelo afirma oferecer suporte a 76 estilos visuais, abrangendo categorias como fotografia realista, quadrinhos e ukiyo-e.
Em uma demonstração, a entrada “Desenhe um infográfico da Ponte Golden Gate” levou o modelo a planejar automaticamente o layout, gerar um diagrama da estrutura da ponte e anotar dados como “1.711 metros”, com o processo de raciocínio interno visível em tempo real.
Benchmarks: Liderança em raciocínio espacial e geração de referências

Dados publicados pela Luma mostram que o Uni-1 obteve 0,51 no benchmark de raciocínio RISEBench, pontuação superior aos 0,50 do Google Nano Banana 2 e aos 0,46 do OpenAI GPT Image 1.5. Sua pontuação em raciocínio espacial atingiu 0,58, e em raciocínio lógico, 0,32, aproximadamente o dobro da pontuação do GPT Image.
No benchmark de detecção de objetos ODinW-13, o Uni-1 alcançou 46,2 mAP, próximo dos 46,3 do Google Gemini 3 Pro.
No ranking Elo de preferência humana, o Uni-1 ficou em primeiro lugar em preferência geral, estilo e edição, e geração de referência, e em segundo lugar na geração de texto para imagem.
Preços
As cobranças da API são baseadas em tokens: US$ 0,50 por milhão de tokens para texto de entrada, US$ 1,20 por milhão de tokens para imagens de entrada, US$ 3,00 por milhão de tokens para texto de saída e cadeia de pensamentos, e US$ 45,45 por milhão de tokens para imagens de saída.
Convertido para uma base por imagem: texto para imagem (2048px) custa aproximadamente US$ 0,0909, edição com uma única imagem de referência cerca de US$ 0,0933 e oito imagens de referência cerca de US$ 0,1101.
A VentureBeat informou que, em cenários empresariais com resolução de 2K, o Uni-1 custa de 10% a 30% menos do que o Google Nano Banana 2.
Contexto
A Luma Labs anteriormente se concentrava em produtos de geração de vídeo, como o Dream Machine (série Ray3). Em 5 de março, a empresa lançou a plataforma de agentes criativos Luma Agents, também baseada na arquitetura Unified Intelligence. O Uni-1 é a primeira aplicação dessa arquitetura em um produto de imagem estática.
Poucas horas após o lançamento, publicações relacionadas na plataforma X alcançaram mais de 2,3 milhões de visualizações. A Luma afirmou que versões em vídeo e áudio serão lançadas em breve, embora cronogramas específicos não tenham sido divulgados.
Experimente em: lumalabs.ai/uni-1
Política obrigatória de pesquisa com IA impulsiona êxodo; DuckDuckGo registra aumento no número de usuários
Após o anúncio feito pela Google na conferência I/O de 2026 sobre uma reformulação completa do seu mecanismo de busca com IA, muitos usuários começaram a procurar alternativas mais controláveis, já qu
Xiaohongshu passa por reestruturação: Conan é nomeado presidente, cria o Departamento de IA e a Divisão Internacional Rednote
Em 30 de abril, a Xiaohongshu enviou um memorando interno a todos os funcionários anunciando o lançamento de uma nova reestruturação organizacional. O cerne dessa mudança envolve a integração total de











