Sand AI、オープンソースのビデオジェネレーター「MAGI-1」を発表

家

ニュース

2025年11月12日

JackMoore

AIを取り巻く環境は急速な変化を遂げており、その革命的な変化をリードしているのが動画生成技術である。数多くのモデルが最先端のテキストから動画、画像から動画への機能を約束しているが、真に優れたオープンソースのソリューションを発見することは依然として難しい。この記事では、Apache 2.0でライセンスされたSand AIのオープンソース動画生成モデルであるMAGI-1を検証し、その革新的な合成手法と動画コンテンツ制作を再定義する能力を探ります。

キーポイント

MAGI-1は、オープンソースの映像合成モデルとして、Apache 2.0ライセンスで運用されている。

セグメント生成戦略を採用し、固定長のビデオクリップを順次生成する。

このモデルには、変換器ベースの変分オートエンコーダーフレームワークが組み込まれている。

MAGI-1は、拡張された時間的関係を管理するための革新的な分散アテンションシステムを導入している。

そのアーキテクチャは、特にストリーミングとリアルタイムのビデオ制作用に設計されている。

Massed Computeは、この分析に利用されたVMとGPUリソースを提供します。

CAMEL AIは、MAGI-1のデモビデオを後援しています。

MAGI-1: Sand AIのビデオモデルの総合的な検証

現在の動画生成技術を探る

人工知能は、特に映像生成の急成長分野で、新境地を開拓し続けています。多くのプラットフォームが優れた性能を主張する一方で、真に卓越したビデオ生成システムは依然として希少である。

GoogleのVideo V2(VO2)はその代替の一つであるが、独自のライセンスによりローカルにインストールすることができない。

MAGI-1は、一般にアクセス可能な高品質のビデオ合成ツールを提供することで、この制限に対処する。先進的な機能を提供するだけでなく、開発者やクリエイターがこのダイナミックな分野でイノベーションを起こす力を与え、協調的な進歩を促進する。

様々な試みにもかかわらず、優れたアクセシブルなソリューションはまだ見つかっていません。

MAGI-1の分割映像制作手法

MAGI-1」は、完全なシーケンスを同時に生成する従来の方法とは異なり、独自の手法を採用しています。

MAGI-1では、自動回帰処理により24フレームのセグメントを段階的に作成することで、映像の長さに関わらず、スムーズなトランジションと一貫したメモリ使用量を実現しています。

このセグメントベースのアプローチは、複数のクリップの同時処理を可能にする。

各セグメントは、後続のクリップ生成の前に逐次的な潜在空間の洗練を受けるため、時間的な精度を維持しながら、ストリーミングアプリケーションの並列処理をサポートします。

Apache 2.0ライセンスのオープンソースソリューションとして、MAGI-1はテキスト、画像、動画の入力変換をサポートしています。

技術アーキテクチャの概要

MAGI-1の基盤は、高度な変換器ベースの変分オートエンコーダ構成で構成されています。

このフレームワークは、ビジュアルデータを効率的に圧縮・再構成します。

変換器ブロックスタックは、拡張された時間的関係に対応する新しいメカニズムによって強化された、潜在空間への映像圧縮を促進する。

このモデルは拡散技術とフローマッチング蒸留を統合し、処理速度と出力品質を最適化する。

プロジェクト・サポートの詳細

Massed Computeへの謝辞

著者は、MAGI-1の評価に不可欠な仮想マシンとGPUリソースを提供してくれたMassed Compute社に謝意を表します。同社のクラウド・インフラストラクチャ・ソリューションは、アクセス可能で経済的なAI開発リソースを可能にする。

CAMEL AIによるマルチエージェント開発への貢献

CAMEL AIは、AIクラウドエンジニアリングを推進するコミットメントの一環として、このビデオデモを後援しています。同社のオープンソース・イニシアチブは、データ生成のスケーリングと自動タスク・ソリューションのためのマルチエージェント・システムを開発しています。

実装ガイド

システム要件

DockerはMAGI-1を実装するための唯一の前提条件であり、包括的なドキュメントによってインストールと依存関係の管理が効率化されています。

この評価では、Dockerのバージョン26.1.0を使用しました。

Dockerのインストール手順

docker pull sandai/magi:latest を実行してコンテナイメージを取得します。

このダウンロードにはかなりの時間を要することに注意してください。

GPUアクセラレーションには、以下を使用します：

docker run -it --gpus all --privileged --shm-size=32g --name magi --net=host --ipc=host --ulimit memlock=-1 --ulimit stack=67168636 sandai/magi:latest /bin/bash

ソースコードの取得

リポジトリをクローンします：

git clone https://github.com/SandAI-org/MAGI-1.git && cd MAGI-1

実行パラメータ

4.5Bモデルが使用できないため、24B構成を選択：

bash example/24B/run.sh

代替コマンドにより、画像からビデオへの変換が可能です。

ライセンス情報

コストに関する考慮事項

オープンソースプロジェクトであるため、MAGI-1にライセンス費用は発生しないが、計算リソース要件により適切なハードウェアが必要となる。

性能評価

利点

オープンソースライセンスのため、コミュニティ開発が容易

分割処理により効率的な並列処理が可能

トランスフォーマーアーキテクチャによる高品質な出力

複数の入力モダリティをサポート

制限事項

生成速度の最適化が必要

大幅なVRAM割り当てが必要

機能的能力

コア機能

ビデオ変換処理
画像から動画への変換
テキストからビデオへの合成
セグメント生成アーキテクチャ

アプリケーション・シナリオ

理想的な使用例

自然なトランジション映像制作
動画変換アプリケーション
開発環境ビデオ合成

よくあるお問い合わせ

ライセンスについて

MAGI-1のApache 2.0ライセンスは、無制限の使用と改変を許可しています。

ハードウェア仕様

NVIDIA RTX A6000ハードウェアを使用し、GPUアクセラレーションを推奨。

フォーマット互換性

本システムは、多様なアプリケーションのための可変解像度と持続時間をサポートしている。

比較分析

競合他社との差別化

MAGI-1のセグメント化された世代は、フルシーケンスの代替製品に比べてメモリオーバーヘッドを削減します。

実用的な実装

ソーシャル・メディア・コンテンツの作成、ビデオのエンハンスメント、インタラクティブなビジュアル・システムなどの用途が考えられます。

Yaoke Media初のAIGCドラマ『秦嶺の青銅の謎』が本日配信開始、AIが演じる主演キャストが登場本日、Yaoke MediaのAIGCファンタジー・ミステリー短編ドラマ『秦嶺青銅の秘話』が正式に公開されました。同社が初めて契約した2人のAI俳優、秦凌月と林西燕燕が主演を務め、物語は謎に包まれた秦嶺の鉱山地帯を舞台に展開されます。物語は、引退した諜報員・秦月がチームを率いてその奥深くへと入り込み、長年埋もれていた鉱山事故と、2世代にわたる血の生贄の真実を暴いていく様子を描きます。その真実は、

サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、

WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作

関連特集おすすめ

仕事

おすすめのAI経費管理ツール：レシートをスキャンして、業務経費を自動分類

2026年最新・最高のAI経費管理ツール：レシートをスキャンし、法人経費を自動分類する高評価ツールをご紹介。手間いらずの経費管理、正確な財務追跡、コンプライアンス対応の効率化を実現する、画期的なソリューションをご覧ください。無料版と有料版の比較表は厳選され、毎週更新されるため、最適なツール選びにお役立ていただけます。XIX.AIの専門家が厳選したツールで、AIの力を最大限に活用しましょう。

10 ツール

xix.ai

仕事

おすすめのAI採用ツール：履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう！

10 ツール

xix.ai

生産性

AIパーソナルウェルネス＆集中力コーチ：バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス＆集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール

xix.ai

チャットボット

高評価のAI恋愛チャットボット：一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール

xix.ai

教育と学習

最高のAIデータサイエンスメンター：SQL、Pandas、および機械学習ワークフローをマスターしましょう

2026年に最も優れたAIデータサイエンスのメンターを探して、SQL、Pandas、およびMLワークフローをマスターしましょう。XIX.AIで評価の高い厳選されたメンターたちの指導を受けて、力強く、革新的なアドバイスを得てください。無料オプションと有料オプションを実世界の視点から比較しましょう。今日すぐにデータサイエンスのスキルを向上させましょう。

10 ツール

xix.ai

チャットボット

最高のAIを使ったナンパ＆会話トレーニング：社交的な魅力と自信をリアルタイムで高める

XIX.AIで、2026年最高のAIを使った口説き術・会話トレーニングツールを発見しましょう。厳選された高評価のツールが、リアルタイムで社交的な魅力と自信を築くお手伝いをします。無料版と有料版の比較や毎週更新されるランキングを参考に、ぜひ試すべき画期的なツールを探してみてください。今すぐ、あなたの社交力を引き出しましょう。

10 ツール

xix.ai