Google I/O 2025、ジェネレーティブ・メディアの実践的応用を紹介

I/O 2025において、私たちの生成AIへのアプローチは、プレゼンテーションと実用的なアプリケーションの両方を通じて、その能力を実証することでした。私たちは、最新のビデオおよび画像生成モデルであるVeo 3とImagen 4のエキサイティングなアップデートを発表し、Lyria 2へのアクセスを拡大しました。また、当社の最先端の生成モデルを使用して、映画のようなクリップ、シーン、一貫したナラティブをシームレスに作成できるAI映画制作ツール「Flow」も紹介しました。
また、これらのツールを当社の主要な年次イベントに統合しました:主なI/O基調講演のスライド219枚はAIで生成され、基調講演のビジュアルの48%はImagenを使用して制作され、ビデオの80%は何らかの形でVeoまたはImagenを組み込んでいます。ここでは、I/O 2025を実現するために、プロンプト作成プロセスも含め、独自のAIツールをどのように活用したかを詳しくご紹介します:
Veo 2: スピーカーのタイトルカードをスタイリッシュにデザインする
検索担当副社長兼ヘッドであるエリザベス・リードが登壇し、検索に関する主なアップデートを紹介すると、スクリーンには、リズが手を広げると繊細なオレンジ色の折り鶴が現れ、手のひらの真上で回転しながら浮遊する短い動画が流れた。
私たちは、Veo 2を搭載したAI StudioとVertex AI Studioの画像から動画への変換機能を使用して、この動画やその他の登壇者紹介動画を制作しました。私たちは、プロンプトに組み込むために、講演者の顔写真と、彼らの興味や趣味についての詳細を集めました。これは、研究科学者のジェイソン・ボールドリッジ氏のタイトルカード用に作成したプロンプトです:
こちらは、簡単なアニメーションで強化されたVeo 2の生出力と、ステージ上で観客が見たものです:
Imagen 4とVeo 3:映画のストーリーボードと制作
I/Oで上映されたいくつかの映画では、制作にAIツールが活用されていた。オープニング映像では、西部劇をテーマにした街をスリル満点に旅した後、基調講演の幕開けを告げる「Welcome to I/O」と書かれたカラフルな風船がパンニングで映し出された。
制作チームは、さまざまなAIツールを駆使してこの映像を作り上げた。まず、Imagen 4を使ってビデオプロンプト用の画像を生成した。また、Google DeepMindチームとも協力し、Geminiを使用してプロンプトを改良し、望ましい結果を得るために適切な言語を見つける手助けをした。これが最初のシーンで使用されたプロンプトである:
これが生成されたものだ:
チームは、このイメージをVeo 3のプロンプトに組み込みました:
画像と洗練されたプロンプトの準備ができたので、チームは最新のVeo 3テクノロジー(Google AI Ultraプランで利用可能!)を使用して映画の制作を開始しました。また、Veo 3を使用して、出力を確認しながら、俯瞰ショットやワイドアングル、さまざまなビジュアルを追加するなど、リアルタイムで調整を行いました。シーンの撮り直しがしばしば必要な従来の映画制作とは異なり、チームははるかに迅速に反復することができた。コーディングは必要ありませんでした。一部のチームメンバーはColab機能を使ってコードベースの編集を行いましたが、他の多くのメンバーはテキストからビデオへのプロンプトに頼っていました。
これは、映画の最終シーンの1つを作成するために使用されたプロンプトです:
リリア・リアルタイム:トロ・イ・モワとリアルタイムでジャムる
I/Oのプレショーでは、アーティストのToro y MoiがLyria RealTimeをライブ音楽セットで使用し、このモデルの最新機能を実演した。Lyria RealTimeは、私たちのインタラクティブな音楽生成モデルであり、リアルタイムでジェネレーティブ・ミュージックを作成、制御、演奏することができます。楽器、サウンド、ジャンルなどをブレンドしたり、モーフィングしたりすることができます。「これはパフォーマンスであり、実験なんだ。「私が演奏しているものはすべて完全に即興で、コンピューターとジャムっているし、コンピューターも私とジャムっている。
公演までの数週間、チームはトロ・イ・モアにリリア・リアルタイムのプロトタイプを提供し、彼がプロンプトをテストして改良できるようにした。これによって彼は、創造的なコンセプトと本番で使用するプロンプトを開発することができた。彼は、"カオティック・コンガ・プレイヤー "や "ピッチシフトU.K.ジャングル・ドラム "を含む16のサウンド・プロンプトを作成し、物理的なMIDIコントローラのノブに割り当てました。
MIDIコントローラーを介してLyria RealTimeをローカルで実行することで、Toro y Moiはステージ上でこのモデルを使用することができ、観客はインターフェイスが動作している様子をライブで見ることができた。
演奏中、リリア・リアルタイムAPIで構築され、MIDIコントローラー上で動作するアプリが、トロ・イ・モワの背後に表示された。観客は、彼がキーボードとヴォーカルを重ねる際に使用したプロンプトとともに、連続的な音楽ストリームを作成し制御するためのアプリのオプションを見た。
AI StudioのLyria RealTime APIを使って、実際に試してみてください。
AI Studio:AIが生成するスワッグの作成
私たちは、Google AI Studio(モデルを素早くテストし、プロンプトを試すための無料のインターフェース)で複数のGeminiモデルを使用して、今年のI/Oシャツをデザインしました。シャツのタグにあるように、クリエイティブなプロンプトは次のようなものでした:「地面に溶けるGoogle I/Oロゴ、虹色、イラスト、スタジオ照明。私たちがどのように制作したかを紹介しよう:
まず、チームはAI StudioのGemini 2.5 Proを選択し、詳細なシステム指示プロンプトで目的を定義しました。
これらのガイドラインを設定した後、前述のクリエイティブなプロンプトを入力しました。するとGemini 2.5 Proは、希望する画像出力のための要件とスタイルのアイデアのリストを生成した。例えば「コアシェイプ:核となる形状:3つの元の形状(全体的な長方形、細いスラッシュ/長方形、円柱)の基本的な幾何学的形状は、溶融効果を側面に適用した場合でも、明確に認識でき、視覚的に明確でなければなりません。溶けるペイントの効果以上にコア構造を歪めてはならない。"
チームは、これらの指示書を手に入れると、画像生成機能を備えた我々の主力モデル、ジェミニ2.0フラッシュに切り替え、生成されたリストに基づいてさまざまな画像オプションを作成した。
広範な実験の後、彼らはこれを含むいくつかの最終デザインを選択した。
チームは、Gemini 2.5 Proによる最初のプロンプトの書き換えを回避し、AI StudioのGemini 2.0 Flashに直接移行することも試みた。希望する結果に近づいたものの、2.5 Proの書き換えを使用することで、よりクリエイティブなディテールを持つ、より良い結果が一貫して得られました。その結果は?とてもクールなTシャツができました!
まとめはお済みですか?I/Oクイズであなたの知識を試してみてください。
関連記事
カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示
カカオ・モビリティは、フィジカルAI戦略の一環として、レベル4の自動運転技術を自社開発する計画だ。ソウルCOEXで開催された「2026ワールドITショー」のカンファレンスにおいて、カカオモビリティのフィジカルAI部門長兼副社長であるキム・ジンギュ氏がロードマップを発表した。同氏の講演は、フィジカルAI時代におけるモビリティプラットフォームを軸とした自動運転サービスに焦点を当てたものだった。聯合
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない
億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて
YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大
火曜日、YouTubeは、ディープフェイク検出技術を、特定の政府関係者、政治家候補者、ジャーナリストを対象に拡大すると発表した。このツールはAIによって生成された肖像を識別し、パイロットプログラムの参加者は、YouTubeのポリシーに違反していると判断した無断コンテンツの削除をリクエストできるようになる。この検出システムは、先行するテスト段階を経て、昨年、YouTubeパートナープログラムに参加す
関連特集おすすめ
コメント (1)
0/500
Veo 3 et Imagen 4 semblent impressionnants, mais j'espère que ces avancées en IA générative ne se contentent pas de faire des jolies images. Qu'en est-il de l'impact environnemental de l'entraînement de ces modèles? Les présentations sont cool, mais je veux aussi voir une vraie réflexion éthique derrière. 😅

I/O 2025において、私たちの生成AIへのアプローチは、プレゼンテーションと実用的なアプリケーションの両方を通じて、その能力を実証することでした。私たちは、最新のビデオおよび画像生成モデルであるVeo 3とImagen 4のエキサイティングなアップデートを発表し、Lyria 2へのアクセスを拡大しました。また、当社の最先端の生成モデルを使用して、映画のようなクリップ、シーン、一貫したナラティブをシームレスに作成できるAI映画制作ツール「Flow」も紹介しました。
また、これらのツールを当社の主要な年次イベントに統合しました:主なI/O基調講演のスライド219枚はAIで生成され、基調講演のビジュアルの48%はImagenを使用して制作され、ビデオの80%は何らかの形でVeoまたはImagenを組み込んでいます。ここでは、I/O 2025を実現するために、プロンプト作成プロセスも含め、独自のAIツールをどのように活用したかを詳しくご紹介します:
Veo 2: スピーカーのタイトルカードをスタイリッシュにデザインする
検索担当副社長兼ヘッドであるエリザベス・リードが登壇し、検索に関する主なアップデートを紹介すると、スクリーンには、リズが手を広げると繊細なオレンジ色の折り鶴が現れ、手のひらの真上で回転しながら浮遊する短い動画が流れた。
私たちは、Veo 2を搭載したAI StudioとVertex AI Studioの画像から動画への変換機能を使用して、この動画やその他の登壇者紹介動画を制作しました。私たちは、プロンプトに組み込むために、講演者の顔写真と、彼らの興味や趣味についての詳細を集めました。これは、研究科学者のジェイソン・ボールドリッジ氏のタイトルカード用に作成したプロンプトです:
こちらは、簡単なアニメーションで強化されたVeo 2の生出力と、ステージ上で観客が見たものです:
Imagen 4とVeo 3:映画のストーリーボードと制作
I/Oで上映されたいくつかの映画では、制作にAIツールが活用されていた。オープニング映像では、西部劇をテーマにした街をスリル満点に旅した後、基調講演の幕開けを告げる「Welcome to I/O」と書かれたカラフルな風船がパンニングで映し出された。
制作チームは、さまざまなAIツールを駆使してこの映像を作り上げた。まず、Imagen 4を使ってビデオプロンプト用の画像を生成した。また、Google DeepMindチームとも協力し、Geminiを使用してプロンプトを改良し、望ましい結果を得るために適切な言語を見つける手助けをした。これが最初のシーンで使用されたプロンプトである:
これが生成されたものだ:
チームは、このイメージをVeo 3のプロンプトに組み込みました:
画像と洗練されたプロンプトの準備ができたので、チームは最新のVeo 3テクノロジー(Google AI Ultraプランで利用可能!)を使用して映画の制作を開始しました。また、Veo 3を使用して、出力を確認しながら、俯瞰ショットやワイドアングル、さまざまなビジュアルを追加するなど、リアルタイムで調整を行いました。シーンの撮り直しがしばしば必要な従来の映画制作とは異なり、チームははるかに迅速に反復することができた。コーディングは必要ありませんでした。一部のチームメンバーはColab機能を使ってコードベースの編集を行いましたが、他の多くのメンバーはテキストからビデオへのプロンプトに頼っていました。
これは、映画の最終シーンの1つを作成するために使用されたプロンプトです:
リリア・リアルタイム:トロ・イ・モワとリアルタイムでジャムる
I/Oのプレショーでは、アーティストのToro y MoiがLyria RealTimeをライブ音楽セットで使用し、このモデルの最新機能を実演した。Lyria RealTimeは、私たちのインタラクティブな音楽生成モデルであり、リアルタイムでジェネレーティブ・ミュージックを作成、制御、演奏することができます。楽器、サウンド、ジャンルなどをブレンドしたり、モーフィングしたりすることができます。「これはパフォーマンスであり、実験なんだ。「私が演奏しているものはすべて完全に即興で、コンピューターとジャムっているし、コンピューターも私とジャムっている。
公演までの数週間、チームはトロ・イ・モアにリリア・リアルタイムのプロトタイプを提供し、彼がプロンプトをテストして改良できるようにした。これによって彼は、創造的なコンセプトと本番で使用するプロンプトを開発することができた。彼は、"カオティック・コンガ・プレイヤー "や "ピッチシフトU.K.ジャングル・ドラム "を含む16のサウンド・プロンプトを作成し、物理的なMIDIコントローラのノブに割り当てました。
MIDIコントローラーを介してLyria RealTimeをローカルで実行することで、Toro y Moiはステージ上でこのモデルを使用することができ、観客はインターフェイスが動作している様子をライブで見ることができた。
演奏中、リリア・リアルタイムAPIで構築され、MIDIコントローラー上で動作するアプリが、トロ・イ・モワの背後に表示された。観客は、彼がキーボードとヴォーカルを重ねる際に使用したプロンプトとともに、連続的な音楽ストリームを作成し制御するためのアプリのオプションを見た。
AI StudioのLyria RealTime APIを使って、実際に試してみてください。
AI Studio:AIが生成するスワッグの作成
私たちは、Google AI Studio(モデルを素早くテストし、プロンプトを試すための無料のインターフェース)で複数のGeminiモデルを使用して、今年のI/Oシャツをデザインしました。シャツのタグにあるように、クリエイティブなプロンプトは次のようなものでした:「地面に溶けるGoogle I/Oロゴ、虹色、イラスト、スタジオ照明。私たちがどのように制作したかを紹介しよう:
まず、チームはAI StudioのGemini 2.5 Proを選択し、詳細なシステム指示プロンプトで目的を定義しました。
これらのガイドラインを設定した後、前述のクリエイティブなプロンプトを入力しました。するとGemini 2.5 Proは、希望する画像出力のための要件とスタイルのアイデアのリストを生成した。例えば「コアシェイプ:核となる形状:3つの元の形状(全体的な長方形、細いスラッシュ/長方形、円柱)の基本的な幾何学的形状は、溶融効果を側面に適用した場合でも、明確に認識でき、視覚的に明確でなければなりません。溶けるペイントの効果以上にコア構造を歪めてはならない。"
チームは、これらの指示書を手に入れると、画像生成機能を備えた我々の主力モデル、ジェミニ2.0フラッシュに切り替え、生成されたリストに基づいてさまざまな画像オプションを作成した。
広範な実験の後、彼らはこれを含むいくつかの最終デザインを選択した。
チームは、Gemini 2.5 Proによる最初のプロンプトの書き換えを回避し、AI StudioのGemini 2.0 Flashに直接移行することも試みた。希望する結果に近づいたものの、2.5 Proの書き換えを使用することで、よりクリエイティブなディテールを持つ、より良い結果が一貫して得られました。その結果は?とてもクールなTシャツができました!
まとめはお済みですか?I/Oクイズであなたの知識を試してみてください。
バリー・ディラー:AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない
億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて
YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大
火曜日、YouTubeは、ディープフェイク検出技術を、特定の政府関係者、政治家候補者、ジャーナリストを対象に拡大すると発表した。このツールはAIによって生成された肖像を識別し、パイロットプログラムの参加者は、YouTubeのポリシーに違反していると判断した無断コンテンツの削除をリクエストできるようになる。この検出システムは、先行するテスト段階を経て、昨年、YouTubeパートナープログラムに参加す
Veo 3 et Imagen 4 semblent impressionnants, mais j'espère que ces avancées en IA générative ne se contentent pas de faire des jolies images. Qu'en est-il de l'impact environnemental de l'entraînement de ces modèles? Les présentations sont cool, mais je veux aussi voir une vraie réflexion éthique derrière. 😅





家






