Maison
Le responsable de l'IA chez Google Cloud présente les principaux axes de développement pour améliorer les capacités des modèles

En tant que vice-président des produits chez Google Cloud, Michael Gerstenhaber se consacre principalement à Vertex, la plateforme complète de l’entreprise dédiée au déploiement de l’IA en milieu professionnel. Ce poste lui offre une vision globale de la manière dont les entreprises mettent concrètement en œuvre les modèles d’IA, ainsi que des principaux obstacles qui subsistent pour libérer le potentiel de l’IA agentique.
Ma conversation avec Michael a été marquée par une réflexion particulièrement originale. Il présente les progrès des modèles d'IA comme une avancée simultanée sur trois fronts distincts : l'intelligence brute, la latence de réponse et un troisième facteur crucial : la rentabilité. Ce troisième front concerne moins la capacité pure que l'accessibilité financière, déterminant si un modèle peut être déployé à un coût suffisamment bas pour fonctionner à une échelle massive et imprévisible. Il s'agit d'un cadre précieux pour quiconque cherche à orienter le développement de modèles de pointe dans une nouvelle direction.
Cette interview a été condensée et éditée pour plus de clarté.
Pour commencer, pourriez-vous nous présenter votre parcours dans le domaine de l'IA et votre rôle actuel chez Google ?
Je travaille dans le domaine de l'IA depuis environ deux ans. Après un an et demi chez Anthropic, j'ai rejoint Google il y a environ six mois. Je dirige la plateforme de développement Vertex. Nos principaux utilisateurs sont des ingénieurs qui développent des applications personnalisées. Ils recherchent l'accès à des workflows agentiques, à une plateforme agentique robuste et à la puissance d'inférence des modèles les plus avancés au monde. Mon équipe fournit cette plateforme de base, tandis que les applications destinées aux utilisateurs finaux sont développées par nos clients — des entreprises telles que Shopify et Thomson Reuters — au sein de leurs secteurs d'activité spécifiques.
Qu'est-ce qui vous a motivé à rejoindre Google ?
La position unique de Google réside dans son intégration verticale, qui s'étend de l'interface utilisateur jusqu'à la couche d'infrastructure. Nous concevons nos propres centres de données, gérons l'approvisionnement en énergie, développons des puces sur mesure (TPU), entraînons nos propres modèles de base et contrôlons les couches d'inférence et d'orchestration agentique. Nous proposons des API pour des fonctionnalités telles que la génération de mémoire et de code. En outre, nous avons développé un moteur d’agents dédié à la conformité et à la gouvernance, ainsi que des interfaces grand public et d’entreprise comme Gemini. Ce contrôle de bout en bout est un atout majeur et l’une des principales raisons pour lesquelles j’ai rejoint l’entreprise.
Événement TechCrunchÉconomisez jusqu'à 300 $ ou 30 % sur le TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée entièrement consacrée à la croissance, à l'exécution et à la mise à l'échelle. Bénéficiez des conseils de fondateurs et d'investisseurs qui façonnent le secteur. Réseautez avec des pairs qui se trouvent à des stades de croissance similaires. Repartez avec des stratégies concrètes que vous pourrez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Économisez jusqu'à 300 $ ou 30 % sur le TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée entière consacrée à la croissance, à la mise en œuvre et à la mise à l'échelle. Bénéficiez des conseils de fondateurs et d'investisseurs qui façonnent le secteur. Échangez avec des pairs qui en sont à des stades de croissance similaires. Repartez avec des stratégies concrètes que vous pourrez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Boston, MA | 9 juin 2026 INSCRIVEZ-VOUS MAINTENANTC'est intéressant : malgré leurs différences, les trois principaux laboratoires d'IA semblent très proches en termes de capacités fondamentales. S'agit-il uniquement d'une course à l'intelligence supérieure, ou le paysage est-il plus nuancé ?
Je distingue trois limites de performance distinctes. Premièrement, les modèles comme Gemini Pro sont optimisés pour l’intelligence brute. Les tâches telles que la génération de code complexe en sont un bon exemple : vous souhaitez un résultat de la plus haute qualité possible, même si cela prend plus de temps, car vous devrez maintenir et déployer ce code.
La deuxième limite est la latence. Dans un scénario de service client en direct, une IA doit à la fois disposer de l'intelligence nécessaire pour appliquer une politique (par exemple, traiter un retour ou un surclassement de siège) et de la rapidité requise pour fournir une réponse avant que l'utilisateur ne se désengage. Ici, il faut le modèle le plus intelligent capable de fonctionner dans un délai strict.
La troisième limite est le coût à grande échelle. Une entreprise comme Reddit ou Meta, qui vise à modérer de vastes volumes de contenu, est confrontée à une demande imprévisible. Elle ne peut pas assumer un risque d'entreprise illimité sans savoir comment les coûts évolueront. Elle a besoin du modèle le plus intelligent qu'elle puisse se permettre, tout en étant suffisamment rentable pour gérer un nombre potentiellement infini de tâches.
Une question récurrente est de savoir pourquoi les systèmes d'IA agentique n'ont pas été plus largement adoptés. Les capacités des modèles et les démonstrations impressionnantes existent, mais le changement transformationnel que beaucoup anticipaient il y a un an ne s'est pas pleinement concrétisé. Quels sont les principaux obstacles ?
La technologie sous-jacente n'a que deux ans environ, et l'infrastructure critique fait encore défaut. Nous manquons de modèles établis pour auditer les actions des agents ou autoriser leur accès aux données. La mise en œuvre de ces modèles prêts pour la production nécessite un travail considérable. L'adoption en production est toujours en retard par rapport aux capacités technologiques. Deux ans ne suffisent tout simplement pas pour que toute l'étendue de l'intelligence se reflète dans des systèmes matures et déployés, et c'est là que réside le défi actuel.
L'adoption a été particulièrement rapide en génie logiciel, car elle s'intègre bien aux cycles de développement existants. Les ingénieurs disposent d'environnements de développement et de test sécurisés. Chez Google, le code doit être examiné et approuvé par deux ingénieurs avant de porter la marque de l'entreprise pour les clients. Ces processus impliquant une intervention humaine rendent la mise en œuvre très peu risquée. Nous devons développer des modèles équivalents et sûrs pour d'autres domaines et professions.
Article connexe
Hightouch atteint les 100 millions de dollars de chiffre d'affaires annuel récurrent grâce à ses outils marketing basés sur l'IA
Autrefois, les spécialistes du marketing comptaient sur des graphistes et d’autres professionnels de la création pour produire des images et des vidéos destinées à des campagnes publicitaires en ligne
L'essor du gaz naturel chez Meta pourrait alimenter le réseau électrique du Dakota du Sud
Les centres de données ont pris une telle ampleur que leur consommation d'électricité équivaut désormais à celle de certains États américains. Prenons l'exemple du centre de données Hyperion AI de Met
Google déploie Gemini dans Chrome en Inde
Mercredi, Google a annoncé l'extension de l'intégration de Gemini dans Chrome à de nouvelles régions, notamment l'Inde, le Canada et la Nouvelle-Zélande. Ce déploiement permet aux utilisateurs d'ordin
Recommandations de sujets spéciaux liés
commentaires (1)
Honestly, I'm a bit skeptical about all these "key frontiers" they keep talking about. Every big tech company has their own list, but real enterprise adoption still stumbles on basic stuff like data quality and cost. Vertex might be Google's shiny platform, but without solving those practical headaches, it's just another expensive toy. 🤷♂️

En tant que vice-président des produits chez Google Cloud, Michael Gerstenhaber se consacre principalement à Vertex, la plateforme complète de l’entreprise dédiée au déploiement de l’IA en milieu professionnel. Ce poste lui offre une vision globale de la manière dont les entreprises mettent concrètement en œuvre les modèles d’IA, ainsi que des principaux obstacles qui subsistent pour libérer le potentiel de l’IA agentique.
Ma conversation avec Michael a été marquée par une réflexion particulièrement originale. Il présente les progrès des modèles d'IA comme une avancée simultanée sur trois fronts distincts : l'intelligence brute, la latence de réponse et un troisième facteur crucial : la rentabilité. Ce troisième front concerne moins la capacité pure que l'accessibilité financière, déterminant si un modèle peut être déployé à un coût suffisamment bas pour fonctionner à une échelle massive et imprévisible. Il s'agit d'un cadre précieux pour quiconque cherche à orienter le développement de modèles de pointe dans une nouvelle direction.
Cette interview a été condensée et éditée pour plus de clarté.
Pour commencer, pourriez-vous nous présenter votre parcours dans le domaine de l'IA et votre rôle actuel chez Google ?
Je travaille dans le domaine de l'IA depuis environ deux ans. Après un an et demi chez Anthropic, j'ai rejoint Google il y a environ six mois. Je dirige la plateforme de développement Vertex. Nos principaux utilisateurs sont des ingénieurs qui développent des applications personnalisées. Ils recherchent l'accès à des workflows agentiques, à une plateforme agentique robuste et à la puissance d'inférence des modèles les plus avancés au monde. Mon équipe fournit cette plateforme de base, tandis que les applications destinées aux utilisateurs finaux sont développées par nos clients — des entreprises telles que Shopify et Thomson Reuters — au sein de leurs secteurs d'activité spécifiques.
Qu'est-ce qui vous a motivé à rejoindre Google ?
La position unique de Google réside dans son intégration verticale, qui s'étend de l'interface utilisateur jusqu'à la couche d'infrastructure. Nous concevons nos propres centres de données, gérons l'approvisionnement en énergie, développons des puces sur mesure (TPU), entraînons nos propres modèles de base et contrôlons les couches d'inférence et d'orchestration agentique. Nous proposons des API pour des fonctionnalités telles que la génération de mémoire et de code. En outre, nous avons développé un moteur d’agents dédié à la conformité et à la gouvernance, ainsi que des interfaces grand public et d’entreprise comme Gemini. Ce contrôle de bout en bout est un atout majeur et l’une des principales raisons pour lesquelles j’ai rejoint l’entreprise.
Événement TechCrunchÉconomisez jusqu'à 300 $ ou 30 % sur le TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée entièrement consacrée à la croissance, à l'exécution et à la mise à l'échelle. Bénéficiez des conseils de fondateurs et d'investisseurs qui façonnent le secteur. Réseautez avec des pairs qui se trouvent à des stades de croissance similaires. Repartez avec des stratégies concrètes que vous pourrez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Économisez jusqu'à 300 $ ou 30 % sur le TechCrunch Founder Summit
Rejoignez plus de 1 000 fondateurs et investisseurs au TechCrunch Founder Summit 2026 pour une journée entière consacrée à la croissance, à la mise en œuvre et à la mise à l'échelle. Bénéficiez des conseils de fondateurs et d'investisseurs qui façonnent le secteur. Échangez avec des pairs qui en sont à des stades de croissance similaires. Repartez avec des stratégies concrètes que vous pourrez mettre en œuvre immédiatement.
L'offre prend fin le 13 mars.
Boston, MA | 9 juin 2026 INSCRIVEZ-VOUS MAINTENANTC'est intéressant : malgré leurs différences, les trois principaux laboratoires d'IA semblent très proches en termes de capacités fondamentales. S'agit-il uniquement d'une course à l'intelligence supérieure, ou le paysage est-il plus nuancé ?
Je distingue trois limites de performance distinctes. Premièrement, les modèles comme Gemini Pro sont optimisés pour l’intelligence brute. Les tâches telles que la génération de code complexe en sont un bon exemple : vous souhaitez un résultat de la plus haute qualité possible, même si cela prend plus de temps, car vous devrez maintenir et déployer ce code.
La deuxième limite est la latence. Dans un scénario de service client en direct, une IA doit à la fois disposer de l'intelligence nécessaire pour appliquer une politique (par exemple, traiter un retour ou un surclassement de siège) et de la rapidité requise pour fournir une réponse avant que l'utilisateur ne se désengage. Ici, il faut le modèle le plus intelligent capable de fonctionner dans un délai strict.
La troisième limite est le coût à grande échelle. Une entreprise comme Reddit ou Meta, qui vise à modérer de vastes volumes de contenu, est confrontée à une demande imprévisible. Elle ne peut pas assumer un risque d'entreprise illimité sans savoir comment les coûts évolueront. Elle a besoin du modèle le plus intelligent qu'elle puisse se permettre, tout en étant suffisamment rentable pour gérer un nombre potentiellement infini de tâches.
Une question récurrente est de savoir pourquoi les systèmes d'IA agentique n'ont pas été plus largement adoptés. Les capacités des modèles et les démonstrations impressionnantes existent, mais le changement transformationnel que beaucoup anticipaient il y a un an ne s'est pas pleinement concrétisé. Quels sont les principaux obstacles ?
La technologie sous-jacente n'a que deux ans environ, et l'infrastructure critique fait encore défaut. Nous manquons de modèles établis pour auditer les actions des agents ou autoriser leur accès aux données. La mise en œuvre de ces modèles prêts pour la production nécessite un travail considérable. L'adoption en production est toujours en retard par rapport aux capacités technologiques. Deux ans ne suffisent tout simplement pas pour que toute l'étendue de l'intelligence se reflète dans des systèmes matures et déployés, et c'est là que réside le défi actuel.
L'adoption a été particulièrement rapide en génie logiciel, car elle s'intègre bien aux cycles de développement existants. Les ingénieurs disposent d'environnements de développement et de test sécurisés. Chez Google, le code doit être examiné et approuvé par deux ingénieurs avant de porter la marque de l'entreprise pour les clients. Ces processus impliquant une intervention humaine rendent la mise en œuvre très peu risquée. Nous devons développer des modèles équivalents et sûrs pour d'autres domaines et professions.
Hightouch atteint les 100 millions de dollars de chiffre d'affaires annuel récurrent grâce à ses outils marketing basés sur l'IA
Autrefois, les spécialistes du marketing comptaient sur des graphistes et d’autres professionnels de la création pour produire des images et des vidéos destinées à des campagnes publicitaires en ligne
L'essor du gaz naturel chez Meta pourrait alimenter le réseau électrique du Dakota du Sud
Les centres de données ont pris une telle ampleur que leur consommation d'électricité équivaut désormais à celle de certains États américains. Prenons l'exemple du centre de données Hyperion AI de Met
Google déploie Gemini dans Chrome en Inde
Mercredi, Google a annoncé l'extension de l'intégration de Gemini dans Chrome à de nouvelles régions, notamment l'Inde, le Canada et la Nouvelle-Zélande. Ce déploiement permet aux utilisateurs d'ordin
Honestly, I'm a bit skeptical about all these "key frontiers" they keep talking about. Every big tech company has their own list, but real enterprise adoption still stumbles on basic stuff like data quality and cost. Vertex might be Google's shiny platform, but without solving those practical headaches, it's just another expensive toy. 🤷♂️











