Hogar
El responsable de IA de Google Cloud describe las principales áreas de desarrollo para mejorar las capacidades de los modelos

Como vicepresidente de Producto de Google Cloud, Michael Gerstenhaber centra su atención principalmente en Vertex, la plataforma integral de la empresa para la implementación de IA en el ámbito empresarial. Este cargo le permite tener una amplia perspectiva sobre cómo las empresas están aplicando en la práctica los modelos de IA y cuáles son los principales obstáculos que aún impiden aprovechar todo el potencial de la IA autónoma.
Mi conversación con Michael me proporcionó una visión especialmente original. Él enmarca el avance de los modelos de IA como un impulso simultáneo hacia tres frentes distintos: la inteligencia bruta, la latencia de respuesta y un tercer factor crucial: la rentabilidad. Este tercer frente tiene menos que ver con la capacidad pura y más con la asequibilidad, ya que determina si un modelo puede implementarse a un coste lo suficientemente bajo como para funcionar a una escala masiva e impredecible. Se trata de un marco valioso para cualquiera que desee orientar el desarrollo de modelos de vanguardia hacia una nueva dirección.
Esta entrevista ha sido resumida y editada para mayor claridad.
Para empezar, ¿podrías describir tu trayectoria en IA y tu función actual en Google?
Llevo trabajando en IA desde hace aproximadamente dos años. Tras un año y medio en Anthropic, me incorporé a Google hace unos seis meses. Dirijo la plataforma para desarrolladores Vertex. Nuestros principales usuarios son ingenieros que crean aplicaciones personalizadas. Buscan acceso a flujos de trabajo agenticos, una plataforma agentica robusta y la potencia de inferencia de los modelos más avanzados del mundo. Mi equipo proporciona esa plataforma básica, mientras que las aplicaciones para el usuario final las desarrollan nuestros clientes —empresas como Shopify y Thomson Reuters— dentro de sus sectores específicos.
¿Qué te motivó a dar el salto a Google?
La posición única de Google radica en su integración vertical, que abarca desde la interfaz de usuario hasta la capa de infraestructura. Diseñamos nuestros propios centros de datos, gestionamos el suministro de energía, desarrollamos chips personalizados (TPU), entrenamos nuestros propios modelos fundamentales y controlamos las capas de inferencia y orquestación de agentes. Ofrecemos API para capacidades como la generación de memoria y código. Además, hemos creado un motor de agentes para el cumplimiento normativo y la gobernanza, así como interfaces para consumidores y empresas como Gemini. Este control de extremo a extremo es una fortaleza significativa y una razón clave por la que me incorporé.
Evento de TechCrunchAhorra hasta 300 $ o un 30 % en la TechCrunch Founder Summit
Únete a más de 1000 fundadores e inversores en la TechCrunch Founder Summit 2026 para disfrutar de un día completo dedicado al crecimiento, la ejecución y la escalabilidad. Obtén conocimientos de fundadores e inversores que están marcando el rumbo del sector. Establece contactos con compañeros que se encuentran en etapas de crecimiento similares. Vete con estrategias prácticas que puedas implementar de inmediato.
La oferta termina el 13 de marzo.
Ahorra hasta 300 $ o un 30 % en la TechCrunch Founder Summit
Únete a más de 1000 fundadores e inversores en la TechCrunch Founder Summit 2026 para disfrutar de un día completo dedicado al crecimiento, la ejecución y la expansión. Obtén conocimientos de fundadores e inversores que están marcando el rumbo del sector. Establece contactos con compañeros que se encuentran en etapas de crecimiento similares. Vete con estrategias prácticas que podrás poner en marcha de inmediato.
La oferta finaliza el 13 de marzo.
Boston, MA | 9 de junio de 2026 INSCRÍBETE AHORAEs interesante: a pesar de sus diferencias, los tres principales laboratorios de IA parecen estar muy igualados en cuanto a capacidades básicas. ¿Se trata simplemente de una carrera por una mayor inteligencia, o el panorama es más matizado?
Veo tres límites de rendimiento distintos. En primer lugar, modelos como Gemini Pro están optimizados para la inteligencia bruta. Tareas como la generación de código complejo son un buen ejemplo; se busca un resultado de la mayor calidad posible, aunque lleve más tiempo, porque habrá que mantener e implementar ese código.
El segundo límite es la latencia. En un escenario de atención al cliente en directo, una IA necesita tanto la inteligencia para aplicar políticas (por ejemplo, tramitar una devolución o una mejora de asiento) como la velocidad para dar una respuesta antes de que el usuario pierda el interés. Aquí se necesita el modelo más inteligente que pueda operar dentro de un estricto margen de tiempo.
El tercer límite es el coste a gran escala. Una empresa como Reddit o Meta, cuyo objetivo es moderar grandes volúmenes de contenido, se enfrenta a una demanda impredecible. No pueden asumir un riesgo empresarial ilimitado sin saber cómo se escalarán los costes. Necesitan el modelo más inteligente que puedan permitirse y que, al mismo tiempo, sea lo suficientemente rentable como para gestionar un número potencialmente infinito de tareas.
Una pregunta recurrente es por qué los sistemas de IA con capacidad de agencia no han tenido una adopción más amplia. Las capacidades de los modelos y las impresionantes demostraciones existen, pero el cambio transformador que muchos anticiparon hace un año no se ha materializado del todo. ¿Cuáles son los principales cuellos de botella?
La tecnología subyacente tiene solo unos dos años, y aún falta la infraestructura crítica. Carecemos de patrones establecidos para auditar las acciones de los agentes o autorizar el acceso a los datos por parte de estos. La implementación de estos patrones listos para producción requiere un trabajo considerable. La adopción en producción siempre va por detrás de la capacidad tecnológica. Dos años simplemente no son tiempo suficiente para que todo el alcance de la inteligencia se refleje en sistemas maduros e implementados, y ahí es donde radica el reto actual.
La adopción ha sido excepcionalmente rápida en ingeniería de software porque se integra bien con los ciclos de desarrollo existentes. Los ingenieros disponen de entornos de desarrollo y prueba seguros. En Google, el código requiere la revisión y aprobación de dos ingenieros antes de que lleve la marca de la empresa para los clientes. Estos procesos con intervención humana hacen que la implementación sea de muy bajo riesgo. Necesitamos desarrollar patrones equivalentes y seguros para otros ámbitos y profesiones.
Artículo relacionado
Google lanza Gemini en Chrome en la India
El miércoles, Google anunció que ampliará la integración de Gemini en Chrome a nuevas regiones, entre las que se incluyen la India, Canadá y Nueva Zelanda. Esta actualización permite a los usuarios de
Cursor está en negociaciones para recaudar más de 2000 millones de dólares con una valoración de 50 000 millones, a medida que se acelera el crecimiento de la empresa
La startup de programación de IA Cursor está a punto de cerrar una nueva ronda de financiación que le reportaría al menos 2.000 millones de dólares, según cuatro personas familiarizadas con el asunto.
YouTube amplía la detección de deepfakes mediante IA a políticos, funcionarios públicos y periodistas
El martes, YouTube anunció que va a ampliar su tecnología de detección de deepfakes a un grupo selecto de funcionarios públicos, candidatos políticos y periodistas. La herramienta identifica las imáge
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

Como vicepresidente de Producto de Google Cloud, Michael Gerstenhaber centra su atención principalmente en Vertex, la plataforma integral de la empresa para la implementación de IA en el ámbito empresarial. Este cargo le permite tener una amplia perspectiva sobre cómo las empresas están aplicando en la práctica los modelos de IA y cuáles son los principales obstáculos que aún impiden aprovechar todo el potencial de la IA autónoma.
Mi conversación con Michael me proporcionó una visión especialmente original. Él enmarca el avance de los modelos de IA como un impulso simultáneo hacia tres frentes distintos: la inteligencia bruta, la latencia de respuesta y un tercer factor crucial: la rentabilidad. Este tercer frente tiene menos que ver con la capacidad pura y más con la asequibilidad, ya que determina si un modelo puede implementarse a un coste lo suficientemente bajo como para funcionar a una escala masiva e impredecible. Se trata de un marco valioso para cualquiera que desee orientar el desarrollo de modelos de vanguardia hacia una nueva dirección.
Esta entrevista ha sido resumida y editada para mayor claridad.
Para empezar, ¿podrías describir tu trayectoria en IA y tu función actual en Google?
Llevo trabajando en IA desde hace aproximadamente dos años. Tras un año y medio en Anthropic, me incorporé a Google hace unos seis meses. Dirijo la plataforma para desarrolladores Vertex. Nuestros principales usuarios son ingenieros que crean aplicaciones personalizadas. Buscan acceso a flujos de trabajo agenticos, una plataforma agentica robusta y la potencia de inferencia de los modelos más avanzados del mundo. Mi equipo proporciona esa plataforma básica, mientras que las aplicaciones para el usuario final las desarrollan nuestros clientes —empresas como Shopify y Thomson Reuters— dentro de sus sectores específicos.
¿Qué te motivó a dar el salto a Google?
La posición única de Google radica en su integración vertical, que abarca desde la interfaz de usuario hasta la capa de infraestructura. Diseñamos nuestros propios centros de datos, gestionamos el suministro de energía, desarrollamos chips personalizados (TPU), entrenamos nuestros propios modelos fundamentales y controlamos las capas de inferencia y orquestación de agentes. Ofrecemos API para capacidades como la generación de memoria y código. Además, hemos creado un motor de agentes para el cumplimiento normativo y la gobernanza, así como interfaces para consumidores y empresas como Gemini. Este control de extremo a extremo es una fortaleza significativa y una razón clave por la que me incorporé.
Evento de TechCrunchAhorra hasta 300 $ o un 30 % en la TechCrunch Founder Summit
Únete a más de 1000 fundadores e inversores en la TechCrunch Founder Summit 2026 para disfrutar de un día completo dedicado al crecimiento, la ejecución y la escalabilidad. Obtén conocimientos de fundadores e inversores que están marcando el rumbo del sector. Establece contactos con compañeros que se encuentran en etapas de crecimiento similares. Vete con estrategias prácticas que puedas implementar de inmediato.
La oferta termina el 13 de marzo.
Ahorra hasta 300 $ o un 30 % en la TechCrunch Founder Summit
Únete a más de 1000 fundadores e inversores en la TechCrunch Founder Summit 2026 para disfrutar de un día completo dedicado al crecimiento, la ejecución y la expansión. Obtén conocimientos de fundadores e inversores que están marcando el rumbo del sector. Establece contactos con compañeros que se encuentran en etapas de crecimiento similares. Vete con estrategias prácticas que podrás poner en marcha de inmediato.
La oferta finaliza el 13 de marzo.
Boston, MA | 9 de junio de 2026 INSCRÍBETE AHORAEs interesante: a pesar de sus diferencias, los tres principales laboratorios de IA parecen estar muy igualados en cuanto a capacidades básicas. ¿Se trata simplemente de una carrera por una mayor inteligencia, o el panorama es más matizado?
Veo tres límites de rendimiento distintos. En primer lugar, modelos como Gemini Pro están optimizados para la inteligencia bruta. Tareas como la generación de código complejo son un buen ejemplo; se busca un resultado de la mayor calidad posible, aunque lleve más tiempo, porque habrá que mantener e implementar ese código.
El segundo límite es la latencia. En un escenario de atención al cliente en directo, una IA necesita tanto la inteligencia para aplicar políticas (por ejemplo, tramitar una devolución o una mejora de asiento) como la velocidad para dar una respuesta antes de que el usuario pierda el interés. Aquí se necesita el modelo más inteligente que pueda operar dentro de un estricto margen de tiempo.
El tercer límite es el coste a gran escala. Una empresa como Reddit o Meta, cuyo objetivo es moderar grandes volúmenes de contenido, se enfrenta a una demanda impredecible. No pueden asumir un riesgo empresarial ilimitado sin saber cómo se escalarán los costes. Necesitan el modelo más inteligente que puedan permitirse y que, al mismo tiempo, sea lo suficientemente rentable como para gestionar un número potencialmente infinito de tareas.
Una pregunta recurrente es por qué los sistemas de IA con capacidad de agencia no han tenido una adopción más amplia. Las capacidades de los modelos y las impresionantes demostraciones existen, pero el cambio transformador que muchos anticiparon hace un año no se ha materializado del todo. ¿Cuáles son los principales cuellos de botella?
La tecnología subyacente tiene solo unos dos años, y aún falta la infraestructura crítica. Carecemos de patrones establecidos para auditar las acciones de los agentes o autorizar el acceso a los datos por parte de estos. La implementación de estos patrones listos para producción requiere un trabajo considerable. La adopción en producción siempre va por detrás de la capacidad tecnológica. Dos años simplemente no son tiempo suficiente para que todo el alcance de la inteligencia se refleje en sistemas maduros e implementados, y ahí es donde radica el reto actual.
La adopción ha sido excepcionalmente rápida en ingeniería de software porque se integra bien con los ciclos de desarrollo existentes. Los ingenieros disponen de entornos de desarrollo y prueba seguros. En Google, el código requiere la revisión y aprobación de dos ingenieros antes de que lleve la marca de la empresa para los clientes. Estos procesos con intervención humana hacen que la implementación sea de muy bajo riesgo. Necesitamos desarrollar patrones equivalentes y seguros para otros ámbitos y profesiones.
Google lanza Gemini en Chrome en la India
El miércoles, Google anunció que ampliará la integración de Gemini en Chrome a nuevas regiones, entre las que se incluyen la India, Canadá y Nueva Zelanda. Esta actualización permite a los usuarios de
Cursor está en negociaciones para recaudar más de 2000 millones de dólares con una valoración de 50 000 millones, a medida que se acelera el crecimiento de la empresa
La startup de programación de IA Cursor está a punto de cerrar una nueva ronda de financiación que le reportaría al menos 2.000 millones de dólares, según cuatro personas familiarizadas con el asunto.
YouTube amplía la detección de deepfakes mediante IA a políticos, funcionarios públicos y periodistas
El martes, YouTube anunció que va a ampliar su tecnología de detección de deepfakes a un grupo selecto de funcionarios públicos, candidatos políticos y periodistas. La herramienta identifica las imáge











