Google I/O 2025 muestra las aplicaciones prácticas de los medios generativos

En I/O 2025, nuestro enfoque de la IA generativa consistió en demostrar sus capacidades mediante presentaciones y aplicaciones prácticas. Desvelamos interesantes actualizaciones de nuestros últimos modelos de generación de vídeo e imágenes -Veo 3 e Imagen 4- y ampliamos el acceso a Lyria 2. También presentamos Flow, una herramienta de creación de películas con IA que permite la creación fluida de clips cinematográficos, escenas y narraciones coherentes utilizando nuestros modelos generativos más avanzados.
También integramos estas herramientas en nuestro principal evento anual: 219 diapositivas de la keynote principal de I/O se generaron con IA, el 48% de los visuales de la keynote se produjeron con Imagen y el 80% de los vídeos incorporaron Veo o Imagen de alguna forma. A continuación, te mostramos en detalle cómo aprovechamos nuestras propias herramientas de IA, incluido nuestro proceso de redacción de avisos, para dar vida a I/O 2025:
Veo 2: Diseño con estilo de las tarjetas de presentación de los ponentes
Cuando Elizabeth Reid, nuestra Vicepresidenta y Directora de Búsqueda, subió al escenario para compartir las principales actualizaciones de Búsqueda, se reprodujo en pantalla un breve vídeo en el que Liz abría la mano para mostrar una delicada grulla de origami naranja que giraba y levitaba justo encima de su palma.
Utilizamos la función de conversión de imagen en vídeo de AI Studio y Vertex AI Studio, con tecnología Veo 2, para producir este y otros vídeos de presentación de ponentes. Recopilamos fotos de nuestros ponentes y detalles sobre sus intereses y aficiones para incorporarlos a los mensajes. Este es el mensaje que creamos para la tarjeta de presentación del investigador científico Jason Baldridge:
Este es el resultado bruto de Veo 2, mejorado con animaciones sencillas, y lo que el público vio en el escenario:
Imagen 4 y Veo 3: Guión gráfico y producción de películas
Varias películas proyectadas en I/O utilizaron herramientas de IA en su producción. La película de apertura llevó a los espectadores por un emocionante viaje a través de una ciudad del Oeste antes de hacer un paneo hacia arriba para mostrar globos de colores que decían "Bienvenidos a I/O", dando comienzo a la keynote.
El equipo de producción empleó varias herramientas de IA para crearlo. Empezaron utilizando Imagen 4 para generar imágenes para las indicaciones del vídeo. También colaboraron con el equipo de Google DeepMind, que utilizó Gemini para perfeccionar sus mensajes, ayudándoles a encontrar el lenguaje adecuado para lograr los resultados deseados. Este es el mensaje utilizado para la primera escena:
Esto es lo que generaron:
A continuación, el equipo incorporó esta imagen a la instrucción Veo 3, que incluía instrucciones como las siguientes:
Una vez preparadas las imágenes y las instrucciones, empezaron a producir la película utilizando nuestra última tecnología Veo 3 (disponible a través del plan Google AI Ultra). También utilizaron Veo 3 para realizar ajustes en tiempo real, añadiendo tomas aéreas, ángulos más amplios y diferentes efectos visuales a medida que revisaban el resultado. A diferencia del cine tradicional, en el que a menudo es necesario volver a rodar las escenas, el equipo pudo iterar mucho más rápido. No fue necesario codificar: aunque algunos miembros del equipo utilizaron la función Colab para la edición basada en código, muchos otros se basaron en las indicaciones de texto a vídeo, describiendo las ediciones y peticiones en lenguaje natural.
Este es el mensaje utilizado para crear una de las escenas finales de la película:
Lyria RealTime: Jamming con Toro y Moi en tiempo real
Durante el pre-show de I/O, el artista Toro y Moi utilizó Lyria RealTime en un set musical en directo para demostrar las últimas capacidades del modelo. Lyria RealTime es nuestro modelo de generación de música interactiva que te permite crear, controlar e interpretar música generativa en tiempo real. Puedes mezclar y transformar instrumentos, sonidos, géneros y mucho más. "Esto va a ser una actuación y un experimento", explicó antes de empezar. "Todo lo que voy a tocar es completamente improvisado: estoy improvisando con el ordenador, y el ordenador está improvisando conmigo".
En las semanas previas a la actuación, el equipo proporcionó a Toro y Moi un prototipo Lyria RealTime para que pudiera probar y perfeccionar sus indicaciones. Esto le ayudó a desarrollar un concepto creativo y las indicaciones que utilizaría durante el espectáculo. Creó 16 indicaciones de sonido, entre ellas "chaotic conga player" y "pitch shift U.K. jungle drums", y las asignó a los mandos de un controlador MIDI físico.
La ejecución local de Lyria RealTime a través de un controlador MIDI permitió a Toro y Moi utilizar el modelo en el escenario y ofreció al público una visión en directo de la interfaz en acción.
Durante la actuación, se mostró detrás de Toro y Moi una aplicación creada con la API Lyria RealTime y ejecutada en el controlador MIDI. El público pudo ver las opciones de la aplicación para crear y controlar un flujo continuo de música, así como las indicaciones que utilizaba Toro y Moi cuando superponía teclados y adornos vocales.
Pruébalo tú mismo con la API Lyria RealTime de AI Studio.
AI Studio: Creación de botín generado por IA
Hemos utilizado varios modelos Gemini en Google AI Studio (nuestra interfaz gratuita para probar modelos rápidamente y experimentar con instrucciones) para diseñar la camiseta de I/O de este año con un nuevo logotipo personalizado. Tal y como describe la etiqueta de la camiseta, el mensaje creativo era: "El logotipo de Google I/O fundiéndose en el suelo, colores del arco iris, ilustración, iluminación de estudio". He aquí cómo lo creamos:
En primer lugar, el equipo seleccionó Gemini 2.5 Pro en AI Studio y definió su objetivo con una instrucción detallada del sistema.
Una vez establecidas estas directrices, introdujeron el mensaje creativo mencionado anteriormente. A continuación, Gemini 2.5 Pro generó una lista de requisitos e ideas de estilo para los resultados de imagen deseados. Por ejemplo "Formas básicas: Las formas geométricas fundamentales de las tres formas originales (el rectángulo general, el rectángulo/barra delgada y el cilindro) deben seguir siendo claramente reconocibles y visualmente distintas, incluso con el efecto de fusión aplicado a sus lados. No distorsione la estructura central más allá del efecto de pintura fundente".
Una vez que el equipo tuvo estas instrucciones por escrito, pasaron a nuestro modelo de trabajo, Gemini 2.0 Flash con generación de imágenes, para producir una variedad de opciones de imagen basadas en la lista generada.
Tras una amplia experimentación, seleccionaron varios diseños finales, incluido éste.
Cabe señalar que el equipo también intentó evitar la reescritura inicial con Gemini 2.5 Pro y pasó directamente a Gemini 2.0 Flash en AI Studio. Aunque se acercaron al resultado deseado, el uso de la reescritura 2.5 Pro proporcionó sistemáticamente mejores resultados con más detalles creativos. ¿El resultado? Unas camisetas muy chulas.
¿Listo para un resumen? Ponte al día con los anuncios más importantes de I/O 2025 aquí, y pon a prueba tus conocimientos con nuestro test de I/O.
Artículo relacionado
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física
Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
Recomendaciones de temas especiales relacionados
comentario (1)
0/500
Veo 3 et Imagen 4 semblent impressionnants, mais j'espère que ces avancées en IA générative ne se contentent pas de faire des jolies images. Qu'en est-il de l'impact environnemental de l'entraînement de ces modèles? Les présentations sont cool, mais je veux aussi voir une vraie réflexion éthique derrière. 😅

En I/O 2025, nuestro enfoque de la IA generativa consistió en demostrar sus capacidades mediante presentaciones y aplicaciones prácticas. Desvelamos interesantes actualizaciones de nuestros últimos modelos de generación de vídeo e imágenes -Veo 3 e Imagen 4- y ampliamos el acceso a Lyria 2. También presentamos Flow, una herramienta de creación de películas con IA que permite la creación fluida de clips cinematográficos, escenas y narraciones coherentes utilizando nuestros modelos generativos más avanzados.
También integramos estas herramientas en nuestro principal evento anual: 219 diapositivas de la keynote principal de I/O se generaron con IA, el 48% de los visuales de la keynote se produjeron con Imagen y el 80% de los vídeos incorporaron Veo o Imagen de alguna forma. A continuación, te mostramos en detalle cómo aprovechamos nuestras propias herramientas de IA, incluido nuestro proceso de redacción de avisos, para dar vida a I/O 2025:
Veo 2: Diseño con estilo de las tarjetas de presentación de los ponentes
Cuando Elizabeth Reid, nuestra Vicepresidenta y Directora de Búsqueda, subió al escenario para compartir las principales actualizaciones de Búsqueda, se reprodujo en pantalla un breve vídeo en el que Liz abría la mano para mostrar una delicada grulla de origami naranja que giraba y levitaba justo encima de su palma.
Utilizamos la función de conversión de imagen en vídeo de AI Studio y Vertex AI Studio, con tecnología Veo 2, para producir este y otros vídeos de presentación de ponentes. Recopilamos fotos de nuestros ponentes y detalles sobre sus intereses y aficiones para incorporarlos a los mensajes. Este es el mensaje que creamos para la tarjeta de presentación del investigador científico Jason Baldridge:
Este es el resultado bruto de Veo 2, mejorado con animaciones sencillas, y lo que el público vio en el escenario:
Imagen 4 y Veo 3: Guión gráfico y producción de películas
Varias películas proyectadas en I/O utilizaron herramientas de IA en su producción. La película de apertura llevó a los espectadores por un emocionante viaje a través de una ciudad del Oeste antes de hacer un paneo hacia arriba para mostrar globos de colores que decían "Bienvenidos a I/O", dando comienzo a la keynote.
El equipo de producción empleó varias herramientas de IA para crearlo. Empezaron utilizando Imagen 4 para generar imágenes para las indicaciones del vídeo. También colaboraron con el equipo de Google DeepMind, que utilizó Gemini para perfeccionar sus mensajes, ayudándoles a encontrar el lenguaje adecuado para lograr los resultados deseados. Este es el mensaje utilizado para la primera escena:
Esto es lo que generaron:
A continuación, el equipo incorporó esta imagen a la instrucción Veo 3, que incluía instrucciones como las siguientes:
Una vez preparadas las imágenes y las instrucciones, empezaron a producir la película utilizando nuestra última tecnología Veo 3 (disponible a través del plan Google AI Ultra). También utilizaron Veo 3 para realizar ajustes en tiempo real, añadiendo tomas aéreas, ángulos más amplios y diferentes efectos visuales a medida que revisaban el resultado. A diferencia del cine tradicional, en el que a menudo es necesario volver a rodar las escenas, el equipo pudo iterar mucho más rápido. No fue necesario codificar: aunque algunos miembros del equipo utilizaron la función Colab para la edición basada en código, muchos otros se basaron en las indicaciones de texto a vídeo, describiendo las ediciones y peticiones en lenguaje natural.
Este es el mensaje utilizado para crear una de las escenas finales de la película:
Lyria RealTime: Jamming con Toro y Moi en tiempo real
Durante el pre-show de I/O, el artista Toro y Moi utilizó Lyria RealTime en un set musical en directo para demostrar las últimas capacidades del modelo. Lyria RealTime es nuestro modelo de generación de música interactiva que te permite crear, controlar e interpretar música generativa en tiempo real. Puedes mezclar y transformar instrumentos, sonidos, géneros y mucho más. "Esto va a ser una actuación y un experimento", explicó antes de empezar. "Todo lo que voy a tocar es completamente improvisado: estoy improvisando con el ordenador, y el ordenador está improvisando conmigo".
En las semanas previas a la actuación, el equipo proporcionó a Toro y Moi un prototipo Lyria RealTime para que pudiera probar y perfeccionar sus indicaciones. Esto le ayudó a desarrollar un concepto creativo y las indicaciones que utilizaría durante el espectáculo. Creó 16 indicaciones de sonido, entre ellas "chaotic conga player" y "pitch shift U.K. jungle drums", y las asignó a los mandos de un controlador MIDI físico.
La ejecución local de Lyria RealTime a través de un controlador MIDI permitió a Toro y Moi utilizar el modelo en el escenario y ofreció al público una visión en directo de la interfaz en acción.
Durante la actuación, se mostró detrás de Toro y Moi una aplicación creada con la API Lyria RealTime y ejecutada en el controlador MIDI. El público pudo ver las opciones de la aplicación para crear y controlar un flujo continuo de música, así como las indicaciones que utilizaba Toro y Moi cuando superponía teclados y adornos vocales.
Pruébalo tú mismo con la API Lyria RealTime de AI Studio.
AI Studio: Creación de botín generado por IA
Hemos utilizado varios modelos Gemini en Google AI Studio (nuestra interfaz gratuita para probar modelos rápidamente y experimentar con instrucciones) para diseñar la camiseta de I/O de este año con un nuevo logotipo personalizado. Tal y como describe la etiqueta de la camiseta, el mensaje creativo era: "El logotipo de Google I/O fundiéndose en el suelo, colores del arco iris, ilustración, iluminación de estudio". He aquí cómo lo creamos:
En primer lugar, el equipo seleccionó Gemini 2.5 Pro en AI Studio y definió su objetivo con una instrucción detallada del sistema.
Una vez establecidas estas directrices, introdujeron el mensaje creativo mencionado anteriormente. A continuación, Gemini 2.5 Pro generó una lista de requisitos e ideas de estilo para los resultados de imagen deseados. Por ejemplo "Formas básicas: Las formas geométricas fundamentales de las tres formas originales (el rectángulo general, el rectángulo/barra delgada y el cilindro) deben seguir siendo claramente reconocibles y visualmente distintas, incluso con el efecto de fusión aplicado a sus lados. No distorsione la estructura central más allá del efecto de pintura fundente".
Una vez que el equipo tuvo estas instrucciones por escrito, pasaron a nuestro modelo de trabajo, Gemini 2.0 Flash con generación de imágenes, para producir una variedad de opciones de imagen basadas en la lista generada.
Tras una amplia experimentación, seleccionaron varios diseños finales, incluido éste.
Cabe señalar que el equipo también intentó evitar la reescritura inicial con Gemini 2.5 Pro y pasó directamente a Gemini 2.0 Flash en AI Studio. Aunque se acercaron al resultado deseado, el uso de la reescritura 2.5 Pro proporcionó sistemáticamente mejores resultados con más detalles creativos. ¿El resultado? Unas camisetas muy chulas.
¿Listo para un resumen? Ponte al día con los anuncios más importantes de I/O 2025 aquí, y pon a prueba tus conocimientos con nuestro test de I/O.
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
Veo 3 et Imagen 4 semblent impressionnants, mais j'espère que ces avancées en IA générative ne se contentent pas de faire des jolies images. Qu'en est-il de l'impact environnemental de l'entraînement de ces modèles? Les présentations sont cool, mais je veux aussi voir une vraie réflexion éthique derrière. 😅





Hogar






