Luma AI、テキストとピクセルを同時に生成する自己回帰モデル「Uni-1」を発表
Luma Labsは3月23日、画像生成モデル「Uni-1」をリリースしました。これは、同社の「Unified Intelligence」アーキテクチャに基づいて構築された、初の一般公開モデルとなります。現在、公式サイトにて無料トライアルの提供が開始されており、APIの料金体系も発表されました。また、企業向けアクセスチャネルも順次展開される予定です。

アーキテクチャの転換:拡散モデルから自己回帰モデルへ
Uni-1は、主流の拡散モデルアプローチから離れ、代わりにデコーダーのみの自己回帰型トランスフォーマーを採用しています。テキストと画像のトークンを単一のシーケンス内で交互に配置し、1回のフォワードパスで推論とピクセル生成を完了させます。
LumaのCEOであるAmit Jain氏は、従来のソリューションでは通常、まず言語モデルを用いて計画を立て、その後生成のために拡散モデルに引き継ぐため、2つの段階の間で情報が失われると説明しました。Uni-1の設計は、このギャップを解消することを目的としています。
ジェイン氏は以前Appleに在籍し、Vision Proの開発に携わっていました。
機能:参照画像制御とクロススタイル生成
Uni-1は、1つ以上の参照画像に基づいて画像を生成し、被写体の身元、姿勢、構図を維持します。公式テストでは、複数参照画像モードにおけるキャラクターの一貫性やポートレートの制御において、安定した性能が示されています。
同モデルは、写実的な写真、コミック、浮世絵などのカテゴリーを含む76種類のビジュアルスタイルに対応していると主張している。
デモでは、「ゴールデンゲートブリッジのインフォグラフィックを描いて」と入力すると、モデルが自動的にレイアウトを計画し、橋の構造図を生成し、「1711メートル」などのデータを注釈として付加しました。その内部の推論プロセスはリアルタイムで確認できました。
ベンチマーク:空間推論と参照生成でトップクラス

Lumaが公開したデータによると、Uni-1は推論ベンチマーク「RISEBench」で0.51点を記録し、Google Nano Banana 2の0.50点やOpenAI GPT Image 1.5の0.46点を上回りました。 空間推論スコアは0.58、論理推論は0.32に達し、GPT Imageの約2倍の成績を収めた。
ODinW-13 物体検出ベンチマークでは、Uni-1 は 46.2 mAP を達成し、Google Gemini 3 Pro の 46.3 に迫る結果となりました。
人間の嗜好に基づく Elo ランキングでは、Uni-1 は総合的な嗜好、スタイルと編集、参照生成で 1 位、テキストから画像への生成で 2 位となりました。
価格
API料金はトークンベースです:入力テキストは100万トークンあたり0.50ドル、入力画像は100万トークンあたり1.20ドル、出力テキストおよび思考チェーンは100万トークンあたり3.00ドル、出力画像は100万トークンあたり45.45ドルです。
画像単位に換算すると、テキストから画像への生成(2048px)は約0.0909ドル、参照画像1枚での編集は約0.0933ドル、参照画像8枚での編集は約0.1101ドルとなります。
VentureBeatの報道によると、2K解像度のエンタープライズ環境において、Uni-1のコストはGoogle Nano Banana 2よりも10%から30%安くなります。
背景
Luma Labsはこれまで、Dream Machine(Ray3シリーズ)のような動画生成製品に注力してきました。3月5日、同社は同じくUnified Intelligenceアーキテクチャを基盤とするクリエイティブエージェントプラットフォーム「Luma Agents」をリリースしました。Uni-1は、このアーキテクチャを静止画製品に初めて適用したものです。
リリースから数時間のうちに、Xプラットフォーム上の関連投稿は230万回以上の閲覧数を記録した。Lumaは、具体的なスケジュールは明らかにしていないものの、動画版と音声版も追ってリリースされる予定であると述べた。
体験はこちら:lumalabs.ai/uni-1
関連記事
ベイン・アンド・カンパニーは、エージェント型AIオートメーションのSaaS市場規模が1,000億米ドルに達すると予測している
ベイン・アンド・カンパニーは、エージェント型AIを活用するSaaS企業向けの米国市場規模を1,000億ドルと推計している。同社によると、この市場は企業システム内の調整業務の自動化によって生まれるという。この推計は、AI時代のソフトウェア業界に関するベインの5回シリーズ第2弾に基づくものである。同レポートでは、エージェント型AIがどのような新たなソフトウェア市場を切り拓く可能性があり、SaaSプロバ
AI検索の義務化がユーザー流出を招き、DuckDuckGoの利用者数が急増
Googleが2026年のI/Oカンファレンスで検索エンジンのAI全面刷新を発表した後、AI機能を簡単に「ワンクリックで無効化」する手段がなかったため、多くのユーザーがより自由に制御できる代替手段を探し始めた。 プライバシー重視の検索プラットフォーム「DuckDuckGo」は最近、トラフィックの明らかなシフトが見られ、Googleの積極的なAI推進に不満を持つ人々にとって人気の避難先となっている。
小紅書が組織改編:コナン氏が社長に就任、AI事業部と海外事業部門「Rednote」を新設
4月30日、小紅書は全従業員宛てに社内通達を送り、新たな組織再編の開始を発表した。この変更の核心は、コミュニティ、Eコマース、商業化の3つの事業部門を、同社の技術システムと完全に統合することにある。「Dots」と名付けられたAIファーストの新たな部門が設立され、小紅書がAIを正式に最優先の戦略的課題に位置づけ、ツールとしての機能から中核的な生産力への転換を目指していることを示している。人事面では、
関連特集おすすめ
コメント (0)
0/500
Luma Labsは3月23日、画像生成モデル「Uni-1」をリリースしました。これは、同社の「Unified Intelligence」アーキテクチャに基づいて構築された、初の一般公開モデルとなります。現在、公式サイトにて無料トライアルの提供が開始されており、APIの料金体系も発表されました。また、企業向けアクセスチャネルも順次展開される予定です。

アーキテクチャの転換:拡散モデルから自己回帰モデルへ
Uni-1は、主流の拡散モデルアプローチから離れ、代わりにデコーダーのみの自己回帰型トランスフォーマーを採用しています。テキストと画像のトークンを単一のシーケンス内で交互に配置し、1回のフォワードパスで推論とピクセル生成を完了させます。
LumaのCEOであるAmit Jain氏は、従来のソリューションでは通常、まず言語モデルを用いて計画を立て、その後生成のために拡散モデルに引き継ぐため、2つの段階の間で情報が失われると説明しました。Uni-1の設計は、このギャップを解消することを目的としています。
ジェイン氏は以前Appleに在籍し、Vision Proの開発に携わっていました。
機能:参照画像制御とクロススタイル生成
Uni-1は、1つ以上の参照画像に基づいて画像を生成し、被写体の身元、姿勢、構図を維持します。公式テストでは、複数参照画像モードにおけるキャラクターの一貫性やポートレートの制御において、安定した性能が示されています。
同モデルは、写実的な写真、コミック、浮世絵などのカテゴリーを含む76種類のビジュアルスタイルに対応していると主張している。
デモでは、「ゴールデンゲートブリッジのインフォグラフィックを描いて」と入力すると、モデルが自動的にレイアウトを計画し、橋の構造図を生成し、「1711メートル」などのデータを注釈として付加しました。その内部の推論プロセスはリアルタイムで確認できました。
ベンチマーク:空間推論と参照生成でトップクラス

Lumaが公開したデータによると、Uni-1は推論ベンチマーク「RISEBench」で0.51点を記録し、Google Nano Banana 2の0.50点やOpenAI GPT Image 1.5の0.46点を上回りました。 空間推論スコアは0.58、論理推論は0.32に達し、GPT Imageの約2倍の成績を収めた。
ODinW-13 物体検出ベンチマークでは、Uni-1 は 46.2 mAP を達成し、Google Gemini 3 Pro の 46.3 に迫る結果となりました。
人間の嗜好に基づく Elo ランキングでは、Uni-1 は総合的な嗜好、スタイルと編集、参照生成で 1 位、テキストから画像への生成で 2 位となりました。
価格
API料金はトークンベースです:入力テキストは100万トークンあたり0.50ドル、入力画像は100万トークンあたり1.20ドル、出力テキストおよび思考チェーンは100万トークンあたり3.00ドル、出力画像は100万トークンあたり45.45ドルです。
画像単位に換算すると、テキストから画像への生成(2048px)は約0.0909ドル、参照画像1枚での編集は約0.0933ドル、参照画像8枚での編集は約0.1101ドルとなります。
VentureBeatの報道によると、2K解像度のエンタープライズ環境において、Uni-1のコストはGoogle Nano Banana 2よりも10%から30%安くなります。
背景
Luma Labsはこれまで、Dream Machine(Ray3シリーズ)のような動画生成製品に注力してきました。3月5日、同社は同じくUnified Intelligenceアーキテクチャを基盤とするクリエイティブエージェントプラットフォーム「Luma Agents」をリリースしました。Uni-1は、このアーキテクチャを静止画製品に初めて適用したものです。
リリースから数時間のうちに、Xプラットフォーム上の関連投稿は230万回以上の閲覧数を記録した。Lumaは、具体的なスケジュールは明らかにしていないものの、動画版と音声版も追ってリリースされる予定であると述べた。
体験はこちら:lumalabs.ai/uni-1
AI検索の義務化がユーザー流出を招き、DuckDuckGoの利用者数が急増
Googleが2026年のI/Oカンファレンスで検索エンジンのAI全面刷新を発表した後、AI機能を簡単に「ワンクリックで無効化」する手段がなかったため、多くのユーザーがより自由に制御できる代替手段を探し始めた。 プライバシー重視の検索プラットフォーム「DuckDuckGo」は最近、トラフィックの明らかなシフトが見られ、Googleの積極的なAI推進に不満を持つ人々にとって人気の避難先となっている。
小紅書が組織改編:コナン氏が社長に就任、AI事業部と海外事業部門「Rednote」を新設
4月30日、小紅書は全従業員宛てに社内通達を送り、新たな組織再編の開始を発表した。この変更の核心は、コミュニティ、Eコマース、商業化の3つの事業部門を、同社の技術システムと完全に統合することにある。「Dots」と名付けられたAIファーストの新たな部門が設立され、小紅書がAIを正式に最優先の戦略的課題に位置づけ、ツールとしての機能から中核的な生産力への転換を目指していることを示している。人事面では、





家






