opción
Hogar
Noticias
El CEO de DeepMind, Demis Hassabis, anuncia la integración futura de los modelos Gemini y VEO AI de Google

El CEO de DeepMind, Demis Hassabis, anuncia la integración futura de los modelos Gemini y VEO AI de Google

26 de abril de 2025
188

El CEO de DeepMind, Demis Hassabis, anuncia la integración futura de los modelos Gemini y VEO AI de Google

En un episodio reciente del podcast Possible, copresentado por el cofundador de LinkedIn, Reid Hoffman, el CEO de Google DeepMind, Demis Hassabis, compartió noticias emocionantes sobre los planes de Google. Reveló que Google planea fusionar sus modelos de IA Gemini con los modelos de generación de video Veo. Esta fusión busca mejorar la comprensión de Gemini del mundo físico, haciéndolo más hábil para entender las dinámicas de la vida real.

Hassabis destacó que desde el inicio, Gemini fue diseñado para ser multimodal. "Siempre hemos construido Gemini, nuestro modelo fundacional, para ser multimodal desde el principio," explicó. ¿La motivación detrás de este enfoque? Una visión para un asistente digital universal que realmente pueda ayudar en la vida cotidiana. "Un asistente que … realmente te ayude en el mundo real," elaboró Hassabis.

La industria de la IA avanza constantemente hacia lo que podrías llamar modelos "omni"—aquellos capaces de manejar y sintetizar diversos tipos de medios. Las últimas iteraciones de Gemini de Google, por ejemplo, pueden producir no solo texto, sino también audio e imágenes. Mientras tanto, el modelo predeterminado de ChatGPT de OpenAI puede generar imágenes al instante, incluyendo arte encantador al estilo de Studio Ghibli. Amazon no se queda atrás, con planes para lanzar un modelo "de cualquier a cualquier" más adelante este año.

Estos modelos omni requieren una enorme cantidad de datos de entrenamiento—piensa en imágenes, videos, audio y texto. Hassabis insinuó que los datos de video de Veo provienen principalmente de YouTube, un tesoro propiedad de Google. "Básicamente, al ver videos de YouTube —muchos videos de YouTube— [Veo 2] puede descifrar, sabes, la física del mundo," señaló.

Google había mencionado previamente a TechCrunch que sus modelos "podrían" estar entrenados con "algo" de contenido de YouTube, en línea con los acuerdos hechos con los creadores de YouTube. Vale la pena señalar que el año pasado, Google amplió sus términos de servicio, en parte para acceder a más datos para entrenar sus modelos de IA.

Artículo relacionado
Google integra IA autónoma y widgets con código de ambiente en Android Google integra IA autónoma y widgets con código de ambiente en Android Google anunció el martes, durante el evento «Android Show: I/O Edition», una nueva serie de funciones de IA bajo su marca Gemini Intelligence. Estas capacidades incluyen la posibilidad de que la IA ge
El modelo de IA de Meta destaca, pero la identidad de código abierto se ve mermada El modelo de IA de Meta destaca, pero la identidad de código abierto se ve mermada El panorama de la IA de código abierto siempre ha ofrecido numerosas opciones. Durante años, los desarrolladores pudieron acceder a modelos como Mistral, Falcon y un número cada vez mayor de alternati
Un padre demanda a Google y culpa al chatbot Gemini de la ilusión fatal que sufrió su hijo Un padre demanda a Google y culpa al chatbot Gemini de la ilusión fatal que sufrió su hijo Jonathan Gavalas, de 36 años, comenzó a utilizar el chatbot de IA Gemini de Google en agosto de 2025 para que le ayudara con las compras, la redacción de textos y la planificación de viajes. El 2 de o
Recomendaciones de temas especiales relacionados
Texto a voz Las mejores herramientas de voz con IA para desarrolladores de videojuegos independientes: ahorra tiempo en la grabación de voces para juegos de rol y novelas visuales
Las mejores herramientas de voz con IA para desarrolladores de videojuegos independientes: ahorra tiempo en la grabación de voces para juegos de rol y novelas visuales

¡Descubre las mejores herramientas de voz con IA de 2026 para desarrolladores de videojuegos! La lista seleccionada por XIX.AI incluye soluciones de primera categoría que marcarán un antes y un después, y que te permitirán ahorrar tiempo y dinero en la locución de juegos de rol y novelas visuales. Explora comparativas entre opciones gratuitas y de pago, pruebas en condiciones reales y clasificaciones que se actualizan semanalmente. ¡Encuentra hoy mismo tu herramienta de voz perfecta!

10 herramientas
xix.ai
Educación y aprendizaje Los mejores herramientas de repetición espaciada con IA: optimiza los horarios de estudio para estudiantes de medicina y derecho
Los mejores herramientas de repetición espaciada con IA: optimiza los horarios de estudio para estudiantes de medicina y derecho

Descubra los mejores herramientas de repetición espacial de IA para 2026, seleccionadas por XIX.AI. Nuestras opciones más recomendadas y revolucionarias ayudan a estudiantes de medicina y derecho a optimizar sus horarios de estudio para lograr un mayor retención del conocimiento. Compare las opciones gratuitas con las pagas mediante pruebas reales y clasificaciones actualizadas semanalmente. Despliegue todo su potencial de aprendizaje ahora mismo.

10 herramientas
xix.ai
Creación de vídeos Las mejores plataformas de IA para convertir texto en vídeo, destinadas a la redacción de guiones y la narración visual
Las mejores plataformas de IA para convertir texto en vídeo, destinadas a la redacción de guiones y la narración visual

Las mejores plataformas de IA para convertir texto en vídeo de 2026: las herramientas mejor valoradas para la redacción de guiones y la narración visual. Descubre soluciones potentes y revolucionarias para transformar tu texto en vídeos atractivos. Compara las opciones gratuitas con las de pago gracias a nuestras clasificaciones, que se actualizan semanalmente, y a nuestras pruebas en condiciones reales. Encuentra la plataforma perfecta para potenciar tu creatividad y productividad. Explora la selección cuidada de XIX.AI.

10 herramientas
xix.ai
chatbot Orquestadores de Agentes Multiservidores AI: Diseño de Flujos de Trabajo Automatizados y Complejos a través del Lenguaje Natural
Orquestadores de Agentes Multiservidores AI: Diseño de Flujos de Trabajo Automatizados y Complejos a través del Lenguaje Natural

2026 Últimas novedades: Descubra los mejores herramientas de inteligencia artificial para diseñar flujos de trabajo automatizados complejos a través del lenguaje natural. Nuestra lista seleccionada incluye las plataformas más reconocidas y potentes para una automatización de tareas sin problemas y una gestión inteligente de procesos. Compare opciones gratuitas y pagadas con información basada en casos reales. Despliegue todo su potencial con las clasificaciones actualizadas semanalmente por expertos de XIX.AI.

10 herramientas
xix.ai
Edición de imágenes Mejor software de reducción de ruido por IA: Elimina las imperfecciones y artefactos en fotografías nocturnas con poca luz
Mejor software de reducción de ruido por IA: Elimina las imperfecciones y artefactos en fotografías nocturnas con poca luz

Descubra los mejores softwares de reducción de ruido por IA para la fotografía nocturna en condiciones de poca luz en 2026. Nuestra lista, seleccionada cuidadosamente y evaluada por expertos, compara herramientas gratuitas con aquellas pagadas, e incluye pruebas reales y clasificaciones actualizadas semanalmente. Elimine fácilmente las imperfecciones y los artefactos en sus imágenes. Despliegue todo el potencial de la IA en XIX.AI.

10 herramientas
xix.ai
chatbot Los mejores generadores personalizados de novias con IA: diseña personalidades, aficiones e historias personales únicas
Los mejores generadores personalizados de novias con IA: diseña personalidades, aficiones e historias personales únicas

Descubre los mejores generadores personalizados de novias con IA de 2026 en XIX.AI. Explora nuestra lista seleccionada y mejor valorada para diseñar personalidades únicas, aficiones e historias de fondo detalladas. Compara las opciones gratuitas con las de pago gracias a opiniones reales. Consigue hoy mismo a tu compañera creativa perfecta.

10 herramientas
xix.ai
comentario (2)
0/500
EdwardJackson
EdwardJackson 2 de abril de 2026 16:00:37 GMT+02:00

The integration of Gemini and Veo sounds promising! Could this be the key to generating truly coherent multimodal content, or are we just stitching together different black boxes? The computational cost for such combined models might be enormous though. A fascinating glimpse into the future roadmap of Google's AI.

RalphSanchez
RalphSanchez 1 de agosto de 2025 04:48:18 GMT+02:00

Wow, merging Gemini with Veo sounds like a game-changer! Can't wait to see how this powers up video creation. But, like, is Google trying to dominate every AI corner now? 😅

OR