Дом
Luma AI представляет авторегрессионную модель Uni-1, которая одновременно генерирует текст и пиксели
23 марта компания Luma Labs представила свою модель генерации изображений Uni-1, которая стала первой общедоступной моделью компании, построенной на архитектуре Unified Intelligence. На официальном сайте открыт бесплатный пробный доступ, объявлены цены на API, а каналы доступа для корпоративных клиентов запускаются постепенно.

Смена архитектуры: от диффузионных моделей к авторегрессионным
Uni-1 отходит от преобладающего подхода диффузионных моделей, выбирая вместо этого авторегрессивный трансформер, состоящий только из декодера. Он располагает текстовые и графические токены в чередующейся последовательности в рамках одной последовательности, завершая инференцию и генерацию пикселей за один проход.
Генеральный директор Luma Амит Джейн пояснил, что традиционные решения обычно сначала используют языковую модель для планирования, а затем передают задачу генерации диффузионной модели, что приводит к потере информации между этими двумя этапами. Конструкция Uni-1 направлена на устранение этого пробела.
Ранее Джейн работал в Apple и участвовал в разработке Vision Pro.
Возможности: управление эталонным изображением и генерация в разных стилях
Uni-1 поддерживает генерацию изображений на основе одного или нескольких эталонных изображений, сохраняя идентичность, позу и композицию объекта. Официальные тесты показывают стабильную производительность при обеспечении согласованности персонажей и управлении портретами в режиме с несколькими эталонными изображениями.
Модель поддерживает 76 визуальных стилей, охватывающих такие категории, как реалистичная фотография, комиксы и укиё-э.
В ходе демонстрации ввод запроса «Нарисуй инфографику моста Золотые Ворота» привел к тому, что модель автоматически спланировала макет, сгенерировала схему конструкции моста и добавила аннотации с данными, такими как «1711 метров», при этом внутренний процесс рассуждений был виден в режиме реального времени.
Тесты: лидерство в пространственном мышлении и генерации референций

Данные, опубликованные Luma, показывают, что Uni-1 набрал 0,51 балла в тесте на логическое мышление RISEBench, что выше, чем 0,50 у Google Nano Banana 2 и 0,46 у OpenAI GPT Image 1.5. Его оценка по пространственному мышлению достигла 0,58, а по логическому мышлению — 0,32, что примерно в два раза превышает показатели GPT Image.
В тесте на распознавание объектов ODinW-13 Uni-1 набрал 46,2 mAP, что близко к результату Google Gemini 3 Pro (46,3).
В рейтинге Elo по человеческим предпочтениям Uni-1 занял первое место по общему предпочтению, стилю и редактированию, а также по генерации ссылок, и второе место по генерации изображений из текста.
Ценообразование
Плата за API рассчитывается на основе токенов: 0,50 доллара за миллион токенов для входного текста, 1,20 доллара за миллион токенов для входных изображений, 3,00 доллара за миллион токенов для выходного текста и цепочки мыслей и 45,45 доллара за миллион токенов для выходных изображений.
В пересчете на одно изображение: преобразование текста в изображение (2048px) стоит примерно 0,0909 доллара, редактирование с одним эталонным изображением — около 0,0933 доллара, а с восемью эталонными изображениями — около 0,1101 доллара.
VentureBeat сообщил, что в корпоративных сценариях с разрешением 2K Uni-1 стоит на 10–30 % дешевле, чем Google Nano Banana 2.
Справочная информация
Ранее Luma Labs специализировалась на продуктах для генерации видео, таких как Dream Machine (серия Ray3). 5 марта компания выпустила платформу креативных агентов Luma Agents, также основанную на архитектуре Unified Intelligence. Uni-1 — первое применение этой архитектуры в продукте для статических изображений.
В течение нескольких часов после выпуска соответствующие посты на платформе X набрали более 2,3 миллиона просмотров. Luma заявила, что вслед за этим появятся видео- и аудиоверсии, хотя конкретные сроки не разглашаются.
Попробуйте на: lumalabs.ai/uni-1
Связанная статья
OpenAI возобновляет работу в сфере робототехники, а Automan ищет инженеров для исследований и разработок в области инфраструктуры
1 июня генеральный директор OpenAI Сэм Альтман объявил в социальных сетях, что компания вновь выходит на рынок робототехники, открыв вакансии в команде OpenAI Robotics. Компания ищет инженеров по аппа
Компания Bain прогнозирует, что рынок SaaS в сфере автоматизации на базе агентного ИИ достигнет 100 млрд долларов США
По оценкам компании Bain & Company, объем рынка SaaS-компаний, использующих агентский ИИ, в США составляет 100 миллиардов долларов. По мнению компании, этот рынок формируется за счет автоматизации зад
Обязательное использование искусственного интеллекта в поисковых системах вызывает массовый отток пользователей, а DuckDuckGo фиксирует резкий рост числа пользователей
После того как на конференции Google I/O 2026 было объявлено о полной переработке поисковой системы с использованием искусственного интеллекта, многие пользователи начали искать альтернативы, которые
Рекомендации по связанным специальным темам
Комментарии (0)
23 марта компания Luma Labs представила свою модель генерации изображений Uni-1, которая стала первой общедоступной моделью компании, построенной на архитектуре Unified Intelligence. На официальном сайте открыт бесплатный пробный доступ, объявлены цены на API, а каналы доступа для корпоративных клиентов запускаются постепенно.

Смена архитектуры: от диффузионных моделей к авторегрессионным
Uni-1 отходит от преобладающего подхода диффузионных моделей, выбирая вместо этого авторегрессивный трансформер, состоящий только из декодера. Он располагает текстовые и графические токены в чередующейся последовательности в рамках одной последовательности, завершая инференцию и генерацию пикселей за один проход.
Генеральный директор Luma Амит Джейн пояснил, что традиционные решения обычно сначала используют языковую модель для планирования, а затем передают задачу генерации диффузионной модели, что приводит к потере информации между этими двумя этапами. Конструкция Uni-1 направлена на устранение этого пробела.
Ранее Джейн работал в Apple и участвовал в разработке Vision Pro.
Возможности: управление эталонным изображением и генерация в разных стилях
Uni-1 поддерживает генерацию изображений на основе одного или нескольких эталонных изображений, сохраняя идентичность, позу и композицию объекта. Официальные тесты показывают стабильную производительность при обеспечении согласованности персонажей и управлении портретами в режиме с несколькими эталонными изображениями.
Модель поддерживает 76 визуальных стилей, охватывающих такие категории, как реалистичная фотография, комиксы и укиё-э.
В ходе демонстрации ввод запроса «Нарисуй инфографику моста Золотые Ворота» привел к тому, что модель автоматически спланировала макет, сгенерировала схему конструкции моста и добавила аннотации с данными, такими как «1711 метров», при этом внутренний процесс рассуждений был виден в режиме реального времени.
Тесты: лидерство в пространственном мышлении и генерации референций

Данные, опубликованные Luma, показывают, что Uni-1 набрал 0,51 балла в тесте на логическое мышление RISEBench, что выше, чем 0,50 у Google Nano Banana 2 и 0,46 у OpenAI GPT Image 1.5. Его оценка по пространственному мышлению достигла 0,58, а по логическому мышлению — 0,32, что примерно в два раза превышает показатели GPT Image.
В тесте на распознавание объектов ODinW-13 Uni-1 набрал 46,2 mAP, что близко к результату Google Gemini 3 Pro (46,3).
В рейтинге Elo по человеческим предпочтениям Uni-1 занял первое место по общему предпочтению, стилю и редактированию, а также по генерации ссылок, и второе место по генерации изображений из текста.
Ценообразование
Плата за API рассчитывается на основе токенов: 0,50 доллара за миллион токенов для входного текста, 1,20 доллара за миллион токенов для входных изображений, 3,00 доллара за миллион токенов для выходного текста и цепочки мыслей и 45,45 доллара за миллион токенов для выходных изображений.
В пересчете на одно изображение: преобразование текста в изображение (2048px) стоит примерно 0,0909 доллара, редактирование с одним эталонным изображением — около 0,0933 доллара, а с восемью эталонными изображениями — около 0,1101 доллара.
VentureBeat сообщил, что в корпоративных сценариях с разрешением 2K Uni-1 стоит на 10–30 % дешевле, чем Google Nano Banana 2.
Справочная информация
Ранее Luma Labs специализировалась на продуктах для генерации видео, таких как Dream Machine (серия Ray3). 5 марта компания выпустила платформу креативных агентов Luma Agents, также основанную на архитектуре Unified Intelligence. Uni-1 — первое применение этой архитектуры в продукте для статических изображений.
В течение нескольких часов после выпуска соответствующие посты на платформе X набрали более 2,3 миллиона просмотров. Luma заявила, что вслед за этим появятся видео- и аудиоверсии, хотя конкретные сроки не разглашаются.
Попробуйте на: lumalabs.ai/uni-1
OpenAI возобновляет работу в сфере робототехники, а Automan ищет инженеров для исследований и разработок в области инфраструктуры
1 июня генеральный директор OpenAI Сэм Альтман объявил в социальных сетях, что компания вновь выходит на рынок робототехники, открыв вакансии в команде OpenAI Robotics. Компания ищет инженеров по аппа
Обязательное использование искусственного интеллекта в поисковых системах вызывает массовый отток пользователей, а DuckDuckGo фиксирует резкий рост числа пользователей
После того как на конференции Google I/O 2026 было объявлено о полной переработке поисковой системы с использованием искусственного интеллекта, многие пользователи начали искать альтернативы, которые











