opción
Hogar
Noticias
El CEO de DeepMind, Demis Hassabis, anuncia la integración futura de los modelos Gemini y VEO AI de Google

El CEO de DeepMind, Demis Hassabis, anuncia la integración futura de los modelos Gemini y VEO AI de Google

26 de abril de 2025
119

El CEO de DeepMind, Demis Hassabis, anuncia la integración futura de los modelos Gemini y VEO AI de Google

En un episodio reciente del podcast Possible, copresentado por el cofundador de LinkedIn, Reid Hoffman, el CEO de Google DeepMind, Demis Hassabis, compartió noticias emocionantes sobre los planes de Google. Reveló que Google planea fusionar sus modelos de IA Gemini con los modelos de generación de video Veo. Esta fusión busca mejorar la comprensión de Gemini del mundo físico, haciéndolo más hábil para entender las dinámicas de la vida real.

Hassabis destacó que desde el inicio, Gemini fue diseñado para ser multimodal. "Siempre hemos construido Gemini, nuestro modelo fundacional, para ser multimodal desde el principio," explicó. ¿La motivación detrás de este enfoque? Una visión para un asistente digital universal que realmente pueda ayudar en la vida cotidiana. "Un asistente que … realmente te ayude en el mundo real," elaboró Hassabis.

La industria de la IA avanza constantemente hacia lo que podrías llamar modelos "omni"—aquellos capaces de manejar y sintetizar diversos tipos de medios. Las últimas iteraciones de Gemini de Google, por ejemplo, pueden producir no solo texto, sino también audio e imágenes. Mientras tanto, el modelo predeterminado de ChatGPT de OpenAI puede generar imágenes al instante, incluyendo arte encantador al estilo de Studio Ghibli. Amazon no se queda atrás, con planes para lanzar un modelo "de cualquier a cualquier" más adelante este año.

Estos modelos omni requieren una enorme cantidad de datos de entrenamiento—piensa en imágenes, videos, audio y texto. Hassabis insinuó que los datos de video de Veo provienen principalmente de YouTube, un tesoro propiedad de Google. "Básicamente, al ver videos de YouTube —muchos videos de YouTube— [Veo 2] puede descifrar, sabes, la física del mundo," señaló.

Google había mencionado previamente a TechCrunch que sus modelos "podrían" estar entrenados con "algo" de contenido de YouTube, en línea con los acuerdos hechos con los creadores de YouTube. Vale la pena señalar que el año pasado, Google amplió sus términos de servicio, en parte para acceder a más datos para entrenar sus modelos de IA.

Artículo relacionado
Google presenta el modo AI y Veo 3 para revolucionar la búsqueda y la creación de videos Google presenta el modo AI y Veo 3 para revolucionar la búsqueda y la creación de videos Google lanzó recientemente el modo AI y Veo 3, dos tecnologías innovadoras destinadas a transformar la búsqueda web y la creación de contenido digital. El modo AI ofrece una experiencia de búsqueda me
Chatbot Gemini Mejora las Capacidades de Edición de Imágenes Chatbot Gemini Mejora las Capacidades de Edición de Imágenes La aplicación de chatbot Gemini de Google ahora permite a los usuarios editar imágenes generadas por IA y cargadas desde teléfonos o computadoras, anunció la compañía en una publicación de blog el mié
Google Presenta Deep Think para Mejorar el Rendimiento de la IA Gemini Google Presenta Deep Think para Mejorar el Rendimiento de la IA Gemini Google está avanzando en sus modelos de IA Gemini de primer nivel.En Google I/O 2025 el martes, la compañía presentó Deep Think, un modo de razonamiento avanzado para su modelo principal Gemini 2.5 Pr
comentario (1)
0/200
RalphSanchez
RalphSanchez 1 de agosto de 2025 04:48:18 GMT+02:00

Wow, merging Gemini with Veo sounds like a game-changer! Can't wait to see how this powers up video creation. But, like, is Google trying to dominate every AI corner now? 😅

Volver arriba
OR