Google Cloud Mejora las Herramientas de Medios de IA con Nuevas Funciones de Música y Video

El miércoles, Google presentó mejoras en su plataforma de nube Vertex AI, potenciando varios modelos de IA generativa de medios propietarios.
Lyria, la IA de texto a música de Google, ahora está en vista previa para usuarios seleccionados, mientras que el modelo de video Veo 2 incorpora opciones avanzadas de edición y efectos visuales. Además, Google introdujo una función de clonación de voz impulsada por Chirp 3, su modelo de procesamiento de audio, para usuarios aprobados. El generador de imágenes Imagen 3 ahora ofrece un rendimiento notablemente mejorado, según Google.
Anunciadas en Cloud Next, estas actualizaciones fortalecen la apuesta de Google por liderar el mercado de IA generativa empresarial, compitiendo de cerca con la plataforma Bedrock de Amazon, que ofrece herramientas de IA similares.
Google promociona Lyria como un reemplazo para las bibliotecas de música libre de derechos, permitiendo a los usuarios producir canciones en diversos estilos, desde solos de piano de jazz hasta ritmos lo-fi.
Chirp 3 soporta la síntesis de voz en aproximadamente 35 idiomas. Presentado inicialmente en vista previa a principios de este año, impulsa Instant Custom Voice, que puede replicar una voz con solo 10 segundos de audio y ahora está ampliamente disponible. Chirp 3 también habilita una nueva herramienta en vista previa, Transcripción con Diarización, que distingue y etiqueta a los hablantes en grabaciones de varias personas.
Para frenar el mal uso, Instant Custom Voice pasa por un proceso de verificación para garantizar los permisos adecuados de uso de la voz, según Google.
Veo 2 ahora permite a los usuarios eliminar fondos, logotipos u objetos de videos y extender los marcos de video, como convertir metraje en formato horizontal a vertical. También soporta ajustar los ángulos de cámara y el ritmo para escenas generadas por IA, creando efectos como lapsos de tiempo o tomas estilo dron, y puede interpolar entre marcos de inicio y fin especificados.
Estas funciones de Veo 2 están actualmente en vista previa.
Google señaló que las mejoras de Imagen 3 optimizan su capacidad para eliminar objetos y restaurar áreas de imágenes faltantes o dañadas.
Todos los medios creados por Imagen, Veo y Lyria (pero no Chirp) llevan la marca de agua SynthID de Google. Google enfatizó que sus modelos de IA generativa incluyen salvaguardas para prevenir la creación de contenido perjudicial.
Google no reveló los datos de entrenamiento para sus modelos, un tema frecuentemente debatido debido a preocupaciones sobre propiedad intelectual. Algunas empresas entrenan IA con material protegido por derechos de autor sin permiso, alegando protecciones de uso justo en EE. UU., aunque los creadores a menudo lo desafían en los tribunales.
Google previamente informó a TechCrunch que ofrece opciones de exclusión para el entrenamiento de modelos y una política de indemnización para proteger a los usuarios de Google Cloud y Vertex AI de reclamaciones de derechos de autor relacionadas con IA.
Artículo relacionado
AI-Powered Wizard of Oz para Deslumbrar en la Pantalla Masiva de la Esfera de Las Vegas
Sphere Entertainment recientemente anunció planes para una versión inmersiva de El Mago de Oz adaptada para su distintivo lugar en Las Vegas, con nuevos detalles que revelan cómo Google y Magnopus est
Google presenta gafas inteligentes Android XR, se asocia con Warby Parker
Google desafía a las gafas Meta Ray-Ban de Meta con nuevas colaboraciones anunciadas en Google I/O 2025, asociándose con Gentle Monster y Warby Parker para desarrollar gafas inteligentes impulsadas po
Apple Explora la Integración de Búsqueda con IA para Safari
Apple está explorando activamente la integración de capacidades de búsqueda impulsadas por IA en Safari. Durante el juicio antimonopolio de Google el miércoles, Eddy Cue, vicepresidente senior de serv
comentario (0)
0/200
El miércoles, Google presentó mejoras en su plataforma de nube Vertex AI, potenciando varios modelos de IA generativa de medios propietarios.
Lyria, la IA de texto a música de Google, ahora está en vista previa para usuarios seleccionados, mientras que el modelo de video Veo 2 incorpora opciones avanzadas de edición y efectos visuales. Además, Google introdujo una función de clonación de voz impulsada por Chirp 3, su modelo de procesamiento de audio, para usuarios aprobados. El generador de imágenes Imagen 3 ahora ofrece un rendimiento notablemente mejorado, según Google.
Anunciadas en Cloud Next, estas actualizaciones fortalecen la apuesta de Google por liderar el mercado de IA generativa empresarial, compitiendo de cerca con la plataforma Bedrock de Amazon, que ofrece herramientas de IA similares.
Google promociona Lyria como un reemplazo para las bibliotecas de música libre de derechos, permitiendo a los usuarios producir canciones en diversos estilos, desde solos de piano de jazz hasta ritmos lo-fi.
Chirp 3 soporta la síntesis de voz en aproximadamente 35 idiomas. Presentado inicialmente en vista previa a principios de este año, impulsa Instant Custom Voice, que puede replicar una voz con solo 10 segundos de audio y ahora está ampliamente disponible. Chirp 3 también habilita una nueva herramienta en vista previa, Transcripción con Diarización, que distingue y etiqueta a los hablantes en grabaciones de varias personas.
Para frenar el mal uso, Instant Custom Voice pasa por un proceso de verificación para garantizar los permisos adecuados de uso de la voz, según Google.
Veo 2 ahora permite a los usuarios eliminar fondos, logotipos u objetos de videos y extender los marcos de video, como convertir metraje en formato horizontal a vertical. También soporta ajustar los ángulos de cámara y el ritmo para escenas generadas por IA, creando efectos como lapsos de tiempo o tomas estilo dron, y puede interpolar entre marcos de inicio y fin especificados.
Estas funciones de Veo 2 están actualmente en vista previa.
Google señaló que las mejoras de Imagen 3 optimizan su capacidad para eliminar objetos y restaurar áreas de imágenes faltantes o dañadas.
Todos los medios creados por Imagen, Veo y Lyria (pero no Chirp) llevan la marca de agua SynthID de Google. Google enfatizó que sus modelos de IA generativa incluyen salvaguardas para prevenir la creación de contenido perjudicial.
Google no reveló los datos de entrenamiento para sus modelos, un tema frecuentemente debatido debido a preocupaciones sobre propiedad intelectual. Algunas empresas entrenan IA con material protegido por derechos de autor sin permiso, alegando protecciones de uso justo en EE. UU., aunque los creadores a menudo lo desafían en los tribunales.
Google previamente informó a TechCrunch que ofrece opciones de exclusión para el entrenamiento de modelos y una política de indemnización para proteger a los usuarios de Google Cloud y Vertex AI de reclamaciones de derechos de autor relacionadas con IA.











