Google I/O 2025 демонстрирует практическое применение генеративных медиа

Дом

Новости

29 ноября 2025 г.

JerryGonzález

122

# ai

Google I/O 2025 демонстрирует практическое применение генеративных медиа

На I/O 2025 наш подход к генеративному ИИ заключался в демонстрации его возможностей с помощью презентаций и практических приложений. Мы представили захватывающие обновления наших последних моделей генерации видео и изображений -eo 3 и Imagen 4 - и расширили доступ к Lyria 2. Мы также представили Flow, инструмент для создания фильмов с использованием искусственного интеллекта, который позволяет беспрепятственно создавать кинематографические клипы, сцены и последовательные повествования с помощью наших самых передовых генеративных моделей.

Мы также интегрировали эти инструменты в наше флагманское ежегодное мероприятие: 219 слайдов основного доклада I/O были сгенерированы искусственным интеллектом, 48 % визуальных материалов основного доклада были созданы с помощью Imagen, а 80 % видеороликов в той или иной форме включали Veo или Imagen. Вот подробный обзор того, как мы использовали наши собственные инструменты искусственного интеллекта, включая процесс написания подсказок, чтобы воплотить в жизнь I/O 2025:

Veo 2: стильный дизайн титульных карточек спикеров

Когда Элизабет Рид, вице-президент и руководитель отдела поиска, вышла на сцену, чтобы рассказать об основных обновлениях поиска, на экране появилось короткое видео, в котором Лиз раскрыла руку и увидела изящного оранжевого журавлика оригами, который вращался и левитировал прямо над ее ладонью.

Мы использовали функцию преобразования изображений в видео в AI Studio и Vertex AI Studio на базе Veo 2 для создания этого и других вступительных видеороликов для докладчиков. Мы собрали фотографии наших докладчиков, а также подробную информацию об их интересах и увлечениях, чтобы включить ее в подсказки. Вот подсказка, которую мы создали для титульной карточки научного сотрудника Джейсона Болдриджа:

Вот необработанный результат Veo 2, дополненный простой анимацией, и то, что зрители увидели на сцене:

Imagen 4 и Veo 3: раскадровка и производство фильмов

Несколько фильмов, показанных на I/O, использовали в своем производстве инструменты искусственного интеллекта. Вступительный фильм отправил зрителей в захватывающее путешествие по городу в стиле вестерн, а затем поднялся вверх и показал разноцветные воздушные шары с надписью "Добро пожаловать на I/O", положив начало основному докладу.

Для его создания команда создателей использовала различные инструменты искусственного интеллекта. Для начала они использовали Imagen 4 для создания изображений для видеоподсказок. Они также сотрудничали с командой Google DeepMind, которая использовала Gemini для доработки подсказок, помогая им найти правильный язык для достижения желаемых результатов. Вот подсказка, использованная для первой сцены:

Вот что получилось:

Затем команда включила это изображение в подсказку Veo 3, которая содержала такие указания, как:

Подготовив изображения и уточненные подсказки, они приступили к созданию фильма с помощью нашей новейшей технологии Veo 3 (доступной в рамках тарифного плана Google AI Ultra!). Они также использовали Veo 3 для внесения корректировок в режиме реального времени: добавляли верхние кадры, более широкие ракурсы и различные визуальные эффекты по мере просмотра результатов. В отличие от традиционного кинематографа, где часто приходится переснимать сцены, команда могла работать гораздо быстрее. Кодирование не требовалось: хотя некоторые члены команды использовали функцию Colab для редактирования с помощью кода, многие другие полагались на текстовые подсказки, описывая правки и запросы на естественном языке.

Вот подсказка, использованная для создания одной из финальных сцен фильма:

Lyria RealTime: Джем с Toro y Moi в реальном времени

Во время предварительного показа I/O артист Toro y Moi использовал Lyria RealTime в живом музыкальном сеттинге, чтобы продемонстрировать новейшие возможности модели. Lyria RealTime - это наша интерактивная модель генерации музыки, которая позволяет создавать, контролировать и исполнять генеративную музыку в режиме реального времени. Вы можете смешивать и изменять инструменты, звуки, жанры и многое другое. "Это будет выступление и эксперимент", - объяснил он перед началом. "Все, что я играю, полностью импровизировано - я играю с компьютером, а компьютер играет со мной".

За несколько недель до выступления команда предоставила Toro y Moi прототип Lyria RealTime, чтобы он мог протестировать и отточить свои подсказки. Это помогло ему разработать творческую концепцию и подсказки для использования во время шоу. Он создал 16 звуковых подсказок, в том числе "хаотичный конга-плеер" и "барабаны джунглей Великобритании со сдвигом высоты тона", и назначил их на ручки физического MIDI-контроллера.

Локальный запуск Lyria RealTime через MIDI-контроллер позволил Toro y Moi использовать модель на сцене и дал зрителям возможность увидеть интерфейс в действии.

Во время выступления приложение, созданное с использованием Lyria RealTime API и работающее на MIDI-контроллере, отображалось позади Toro y Moi. Зрители увидели возможности приложения для создания и управления непрерывным музыкальным потоком, а также подсказки, которые он использовал при наложении клавишных и вокальных украшений.

Попробуйте сами, используя Lyria RealTime API в AI Studio.

AI Studio: Создание генерируемых ИИ сувениров

Мы использовали несколько моделей Gemini в Google AI Studio - нашем бесплатном интерфейсе для быстрого тестирования моделей и экспериментов с подсказками - для создания футболки I/O этого года с совершенно новым пользовательским логотипом. Как указано на бирке футболки, творческая задача заключалась в следующем: "Логотип Google I/O, тающий в земле, цвета радуги, иллюстрация, студийное освещение". Вот как мы его создали:

Сначала команда выбрала Gemini 2.5 Pro в AI Studio и определила свою задачу с помощью подробной инструкции к системе.

После этого они ввели творческую подсказку, упомянутую ранее. Затем Gemini 2.5 Pro сгенерировал список требований и идей стиля для получения желаемых изображений. Например: "Основные формы: Основные геометрические формы трех исходных фигур (общий прямоугольник, тонкая косая линия/прямоугольник и цилиндр) должны оставаться четко узнаваемыми и визуально различимыми, даже если к их сторонам применить эффект плавления. Не искажайте основную структуру за пределами эффекта плавления краски".

Получив письменные инструкции, команда переключилась на нашу "рабочую лошадку" - Gemini 2.0 Flash с функцией генерации изображений, чтобы создать множество вариантов изображений на основе сгенерированного списка.

После длительных экспериментов они выбрали несколько окончательных вариантов дизайна, в том числе и этот.

Стоит отметить, что команда также попробовала обойтись без первоначального переписывания подсказок в Gemini 2.5 Pro и перейти непосредственно к Gemini 2.0 Flash в AI Studio. Хотя они и приблизились к желаемому результату, использование перезаписи в 2.5 Pro неизменно приносило лучшие результаты с большим количеством творческих деталей. Результат? Несколько очень крутых футболок!

Готовы к подведению итогов? Ознакомьтесь с самыми крупными анонсами I/O 2025 здесь и проверьте свои знания с помощью нашей викторины I/O.

Связанная статья

WordPress.com теперь позволяет ИИ-ботам создавать и публиковать посты, а также выполнять другие задачи WordPress.com, популярная платформа для веб-хостинга и публикации контента, теперь внедряет ИИ-агентов — шаг, который может кардинально изменить облик и функциональность Интернета. В пятницу компания

Kakao Mobility представляет план развития автономного вождения 4-го уровня с использованием физического ИИ Компания Kakao Mobility планирует самостоятельно разрабатывать технологии автономного вождения 4-го уровня в рамках своей стратегии «физического ИИ».На конференции World IT Show 2026, прошедшей в сеу

Барри Диллер: доверие к Сэму Альтману теряет значение по мере приближения эры общей искусственной интеллигенции Миллиардер и медиа-магнат Барри Диллер не считает генерального директора OpenAI Сэма Альтмана недостойным доверия, несмотря на недавние сообщения, свидетельствующие об обратном. Выступая на этой недел

Рекомендации по связанным специальным темам

Бизнес

Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов

xix.ai

Бизнес

Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов

xix.ai

Производительность

Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов

xix.ai

Образование и обучение

Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие тренажеры по флирту и общению на базе ИИ: повышайте свою харизму и уверенность в себе в режиме реального времени

Откройте для себя 20 лучших тренажеров по флирту и общению с ИИ на сайте XIX.AI. Наша тщательно подобранная подборка самых популярных инструментов поможет вам развить коммуникабельность и уверенность в себе в режиме реального времени. Ознакомьтесь с незаменимыми инструментами, которые кардинально изменят вашу жизнь, — с сравнением бесплатных и платных версий и еженедельно обновляемым рейтингом. Раскройте свой коммуникативный потенциал уже сегодня.

10 инструментов

xix.ai

Комментарии (1)

0/500

Пожалуйста, войдите в систему

JoseDavis

6 февраля 2026 г., 9:01:01 GMT+03:00

Veo 3 et Imagen 4 semblent impressionnants, mais j'espère que ces avancées en IA générative ne se contentent pas de faire des jolies images. Qu'en est-il de l'impact environnemental de l'entraînement de ces modèles? Les présentations sont cool, mais je veux aussi voir une vraie réflexion éthique derrière. 😅

Лучшие новости

AI Builder и Power Automate Революционизируют Суммирование Документов AI Hosts of Notebooklm подкаста теперь доступны для интервью Китай представляет национальный гуманоидный робот и стандарты воплощенного интеллекта По данным Ramp, корпоративное внедрение ИИ находится на плаву Руководство по создателю изображений Bing: Гайд по генерации искусством ИИ Научитесь создавать музыку ИИ, используя свой голос: пошаговый учебник SUNO iMyFone MagicMic: Обзор и руководство по реальном времени AI изменению голоса Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами DeepSeek V4 становится мультимодальным искусственным интеллектом, меняющим правила игры Компания Embodied Intelligence представляет первый отраслевой стандарт, призванный сдержать неконтролируемый рост

Более

Показан