루마 AI, 텍스트와 픽셀을 동시에 생성하는 ‘Uni-1’ 자기회귀 모델 공개
루마 랩스(Luma Labs)는 3월 23일 이미지 생성 모델 ‘Uni-1’을 출시하며, ‘Unified Intelligence’ 아키텍처를 기반으로 한 자사의 첫 공개 모델을 선보였습니다. 현재 공식 웹사이트에서 무료 체험을 이용할 수 있으며, API 요금제가 발표되었고 기업용 접근 채널도 단계적으로 확대되고 있습니다.

아키텍처 전환: 확산 모델에서 자기회귀 모델로
Uni-1은 주류인 확산 모델 접근 방식에서 벗어나, 대신 디코더 전용 자기회귀 트랜스포머를 채택했습니다. 이 모델은 단일 시퀀스 내에서 텍스트와 이미지 토큰을 교대로 배열하여, 단 한 번의 전방 통과(forward pass)로 추론과 픽셀 생성을 완료합니다.
루마(Luma)의 아미트 제인(Amit Jain) CEO는 기존 솔루션들이 일반적으로 먼저 언어 모델을 사용하여 계획을 수립한 후, 생성 단계에서 확산 모델로 넘겨줌으로써 두 단계 사이에서 정보 손실이 발생한다고 설명했습니다. Uni-1의 설계는 이러한 간극을 해소하는 것을 목표로 합니다.
제인은 이전에 애플에서 근무하며 Vision Pro 개발에 기여한 바 있습니다.
기능: 참조 이미지 제어 및 크로스 스타일 생성
Uni-1은 하나 이상의 참조 이미지를 기반으로 이미지를 생성하며, 피사체의 정체성, 자세, 구도를 유지합니다. 공식 테스트 결과, 다중 참조 이미지 모드에서 캐릭터 일관성 및 인물 제어에 있어 안정적인 성능을 보여줍니다.
이 모델은 사실적인 사진, 만화, 우키요에 등의 범주를 아우르는 76가지 시각적 스타일을 지원한다고 주장합니다.
시연에서 "골든 게이트 브릿지의 인포그래픽을 그려주세요"라고 입력하자, 모델은 자동으로 레이아웃을 계획하고, 교량 구조도를 생성하며, "1711미터"와 같은 데이터를 주석으로 달았으며, 내부 추론 과정을 실시간으로 볼 수 있었습니다.
벤치마크: 공간 추론 및 참조 생성 부문 선두

Luma가 공개한 데이터에 따르면, Uni-1은 RISEBench 추론 벤치마크에서 0.51점을 기록하여 Google Nano Banana 2의 0.50점과 OpenAI GPT Image 1.5의 0.46점보다 높은 점수를 받았습니다. 공간 추론 점수는 0.58, 논리적 추론 점수는 0.32를 기록했으며, 이는 GPT Image의 점수보다 약 2배 높은 수치입니다.
ODinW-13 물체 탐지 벤치마크에서 Uni-1은 46.2 mAP를 기록하여 Google Gemini 3 Pro의 46.3에 근접했습니다.
인간 선호도 Elo 순위에서 Uni-1은 전체 선호도, 스타일 및 편집, 참조 생성 부문에서 1위를 차지했으며, 텍스트-이미지 생성 부문에서는 2위를 차지했습니다.
가격
API 요금은 토큰 단위로 부과됩니다: 입력 텍스트는 100만 토큰당 0.50달러, 입력 이미지는 100만 토큰당 1.20달러, 출력 텍스트 및 사고 체인은 100만 토큰당 3.00달러, 출력 이미지는 100만 토큰당 45.45달러입니다.
이미지당 비용으로 환산하면, 텍스트-이미지(2048px)는 약 0.0909달러, 참조 이미지 1개를 사용한 편집은 약 0.0933달러, 참조 이미지 8개를 사용한 편집은 약 0.1101달러입니다.
VentureBeat는 2K 해상도의 기업용 시나리오에서 Uni-1이 Google Nano Banana 2보다 10%에서 30% 저렴하다고 보도했습니다.
배경
Luma Labs는 이전에 Dream Machine(Ray3 시리즈)과 같은 영상 생성 제품에 주력해 왔습니다. 3월 5일, 이 회사는 Unified Intelligence 아키텍처를 기반으로 한 크리에이티브 에이전트 플랫폼인 Luma Agents를 출시했습니다. Uni-1은 정적 이미지 제품에 이 아키텍처를 적용한 첫 번째 사례입니다.
출시 몇 시간 만에 X 플랫폼의 관련 게시물 조회수가 230만 회를 넘어섰습니다. Luma는 구체적인 일정은 공개하지 않았으나, 향후 동영상 및 오디오 버전도 출시될 예정이라고 밝혔습니다.
체험해 보세요: lumalabs.ai/uni-1
관련 기사
AI 검색 의무화 정책으로 인한 이탈 현상, DuckDuckGo는 사용자 급증
구글이 2026년 I/O 컨퍼런스에서 검색 엔진의 전면적인 AI 개편을 발표한 이후, AI 기능을 간단히 ‘한 번의 클릭으로 비활성화’할 수 있는 방법이 없었기 때문에 많은 사용자들이 더 자유롭게 제어할 수 있는 대안을 찾기 시작했습니다. 개인정보 보호에 중점을 둔 검색 플랫폼 덕덕고(DuckDuckGo)는 최근 트래픽에서 뚜렷한 변화를 보이며, 구글의 공
샤오홍슈 조직 개편: 코난 사장 선임, AI 주력 부서 ‘닷츠’ 및 해외 사업부 ‘레드노트’ 신설
4월 30일, 샤오홍슈는 전 임직원에게 내부 공지를 보내 새로운 조직 개편을 발표했습니다. 이번 개편의 핵심은 커뮤니티, 전자상거래, 상업화라는 세 가지 사업 부문을 회사의 기술 시스템과 완전히 통합하는 것입니다. 'Dots'라는 이름의 새로운 AI 중심 부서가 신설되었으며, 이는 샤오홍슈가 AI를 공식적으로 최우선 전략 과제로 격상시켜, 단순한 도구적 기
텐센트의 ‘샤오롱샤’가 예상을 뛰어넘는 급성장을 기록하자, 운영팀은 처리 용량을 10배로 확대하고 사과와 함께 보상 조치를 취했다
텐센트는 모든 시나리오를 아우르는 AI 지능형 에이전트인 ‘WorkBuddy’를 공식 출시하며, 높은 통합성과 낮은 도입 장벽을 바탕으로 대규모 모델 애플리케이션 레이어 경쟁의 새로운 국면을 열었다.출시 당일 이 제품은 업계의 즉각적인 관심을 끌었다. 사용자 트래픽이 예상을 훨씬 뛰어넘으면서 관련 서비스인 텐센트 클라우드 코드 어시스턴트(CodeBuddy)
관련 특별 주제 추천
의견 (0)
0/500
루마 랩스(Luma Labs)는 3월 23일 이미지 생성 모델 ‘Uni-1’을 출시하며, ‘Unified Intelligence’ 아키텍처를 기반으로 한 자사의 첫 공개 모델을 선보였습니다. 현재 공식 웹사이트에서 무료 체험을 이용할 수 있으며, API 요금제가 발표되었고 기업용 접근 채널도 단계적으로 확대되고 있습니다.

아키텍처 전환: 확산 모델에서 자기회귀 모델로
Uni-1은 주류인 확산 모델 접근 방식에서 벗어나, 대신 디코더 전용 자기회귀 트랜스포머를 채택했습니다. 이 모델은 단일 시퀀스 내에서 텍스트와 이미지 토큰을 교대로 배열하여, 단 한 번의 전방 통과(forward pass)로 추론과 픽셀 생성을 완료합니다.
루마(Luma)의 아미트 제인(Amit Jain) CEO는 기존 솔루션들이 일반적으로 먼저 언어 모델을 사용하여 계획을 수립한 후, 생성 단계에서 확산 모델로 넘겨줌으로써 두 단계 사이에서 정보 손실이 발생한다고 설명했습니다. Uni-1의 설계는 이러한 간극을 해소하는 것을 목표로 합니다.
제인은 이전에 애플에서 근무하며 Vision Pro 개발에 기여한 바 있습니다.
기능: 참조 이미지 제어 및 크로스 스타일 생성
Uni-1은 하나 이상의 참조 이미지를 기반으로 이미지를 생성하며, 피사체의 정체성, 자세, 구도를 유지합니다. 공식 테스트 결과, 다중 참조 이미지 모드에서 캐릭터 일관성 및 인물 제어에 있어 안정적인 성능을 보여줍니다.
이 모델은 사실적인 사진, 만화, 우키요에 등의 범주를 아우르는 76가지 시각적 스타일을 지원한다고 주장합니다.
시연에서 "골든 게이트 브릿지의 인포그래픽을 그려주세요"라고 입력하자, 모델은 자동으로 레이아웃을 계획하고, 교량 구조도를 생성하며, "1711미터"와 같은 데이터를 주석으로 달았으며, 내부 추론 과정을 실시간으로 볼 수 있었습니다.
벤치마크: 공간 추론 및 참조 생성 부문 선두

Luma가 공개한 데이터에 따르면, Uni-1은 RISEBench 추론 벤치마크에서 0.51점을 기록하여 Google Nano Banana 2의 0.50점과 OpenAI GPT Image 1.5의 0.46점보다 높은 점수를 받았습니다. 공간 추론 점수는 0.58, 논리적 추론 점수는 0.32를 기록했으며, 이는 GPT Image의 점수보다 약 2배 높은 수치입니다.
ODinW-13 물체 탐지 벤치마크에서 Uni-1은 46.2 mAP를 기록하여 Google Gemini 3 Pro의 46.3에 근접했습니다.
인간 선호도 Elo 순위에서 Uni-1은 전체 선호도, 스타일 및 편집, 참조 생성 부문에서 1위를 차지했으며, 텍스트-이미지 생성 부문에서는 2위를 차지했습니다.
가격
API 요금은 토큰 단위로 부과됩니다: 입력 텍스트는 100만 토큰당 0.50달러, 입력 이미지는 100만 토큰당 1.20달러, 출력 텍스트 및 사고 체인은 100만 토큰당 3.00달러, 출력 이미지는 100만 토큰당 45.45달러입니다.
이미지당 비용으로 환산하면, 텍스트-이미지(2048px)는 약 0.0909달러, 참조 이미지 1개를 사용한 편집은 약 0.0933달러, 참조 이미지 8개를 사용한 편집은 약 0.1101달러입니다.
VentureBeat는 2K 해상도의 기업용 시나리오에서 Uni-1이 Google Nano Banana 2보다 10%에서 30% 저렴하다고 보도했습니다.
배경
Luma Labs는 이전에 Dream Machine(Ray3 시리즈)과 같은 영상 생성 제품에 주력해 왔습니다. 3월 5일, 이 회사는 Unified Intelligence 아키텍처를 기반으로 한 크리에이티브 에이전트 플랫폼인 Luma Agents를 출시했습니다. Uni-1은 정적 이미지 제품에 이 아키텍처를 적용한 첫 번째 사례입니다.
출시 몇 시간 만에 X 플랫폼의 관련 게시물 조회수가 230만 회를 넘어섰습니다. Luma는 구체적인 일정은 공개하지 않았으나, 향후 동영상 및 오디오 버전도 출시될 예정이라고 밝혔습니다.
체험해 보세요: lumalabs.ai/uni-1
AI 검색 의무화 정책으로 인한 이탈 현상, DuckDuckGo는 사용자 급증
구글이 2026년 I/O 컨퍼런스에서 검색 엔진의 전면적인 AI 개편을 발표한 이후, AI 기능을 간단히 ‘한 번의 클릭으로 비활성화’할 수 있는 방법이 없었기 때문에 많은 사용자들이 더 자유롭게 제어할 수 있는 대안을 찾기 시작했습니다. 개인정보 보호에 중점을 둔 검색 플랫폼 덕덕고(DuckDuckGo)는 최근 트래픽에서 뚜렷한 변화를 보이며, 구글의 공
샤오홍슈 조직 개편: 코난 사장 선임, AI 주력 부서 ‘닷츠’ 및 해외 사업부 ‘레드노트’ 신설
4월 30일, 샤오홍슈는 전 임직원에게 내부 공지를 보내 새로운 조직 개편을 발표했습니다. 이번 개편의 핵심은 커뮤니티, 전자상거래, 상업화라는 세 가지 사업 부문을 회사의 기술 시스템과 완전히 통합하는 것입니다. 'Dots'라는 이름의 새로운 AI 중심 부서가 신설되었으며, 이는 샤오홍슈가 AI를 공식적으로 최우선 전략 과제로 격상시켜, 단순한 도구적 기
텐센트의 ‘샤오롱샤’가 예상을 뛰어넘는 급성장을 기록하자, 운영팀은 처리 용량을 10배로 확대하고 사과와 함께 보상 조치를 취했다
텐센트는 모든 시나리오를 아우르는 AI 지능형 에이전트인 ‘WorkBuddy’를 공식 출시하며, 높은 통합성과 낮은 도입 장벽을 바탕으로 대규모 모델 애플리케이션 레이어 경쟁의 새로운 국면을 열었다.출시 당일 이 제품은 업계의 즉각적인 관심을 끌었다. 사용자 트래픽이 예상을 훨씬 뛰어넘으면서 관련 서비스인 텐센트 클라우드 코드 어시스턴트(CodeBuddy)





집






