Maison
Google Cloud Next '25: les nouvelles puces AI et l'écosystème d'agent défisnt Microsoft et Amazon

Google Cloud fait de grands pas pour consolider sa position dans le monde extrêmement compétitif de l’intelligence artificielle. Lors de la conférence annuelle Cloud Next à Las Vegas, ils ont dévoilé une suite de nouvelles technologies centrées sur les « modèles pensants », les écosystèmes d’agents et une infrastructure spécialisée adaptée aux déploiements massifs d’IA.
La vedette du spectacle était l’unité de traitement tensoriel (TPU) de septième génération, surnommée Ironwood. Google se vante qu’elle offre plus de 42 exaflops de puissance de calcul par pod, ce qui est incroyablement 24 fois plus puissant que le superordinateur de pointe, El Capitan.
« L’opportunité avec l’IA est aussi grande qu’elle peut l’être », a déclaré Amin Vahdat, vice-président de Google et directeur général des systèmes ML et de l’IA cloud, lors d’une conférence de presse préalable à l’événement. « Ensemble avec nos clients, nous propulsons une nouvelle ère dorée d’innovation. »
L’activité cloud de Google bénéficie d’un élan considérable. En janvier, ils ont rapporté un chiffre d’affaires cloud de 12 milliards de dollars pour le quatrième trimestre 2024, soit une augmentation de 30 % par rapport à l’année précédente. L’entreprise a également noté une augmentation de 80 % des utilisateurs actifs sur AI Studio et l’API Gemini au cours du dernier mois.
Comment les nouveaux TPU Ironwood de Google transforment le calcul de l’IA avec une efficacité énergétique
Google se positionne comme le seul grand fournisseur de cloud avec une « plateforme entièrement optimisée pour l’IA », conçue de toutes pièces pour ce qu’ils appellent « l’ère de l’inférence ». Ce changement met l’accent sur l’utilisation des systèmes d’IA pour résoudre des problèmes réels plutôt que de simplement entraîner des modèles.
Ironwood représente un changement significatif dans la philosophie de conception des puces. Contrairement à ses prédécesseurs, qui équilibrent l’entraînement et l’inférence, Ironwood est spécifiquement conçu pour exécuter des modèles d’IA complexes après l’entraînement.
« Il ne s’agit plus des données insérées dans le modèle, mais de ce que le modèle peut faire avec les données après avoir été entraîné », a expliqué Vahdat.
Chaque pod Ironwood contient plus de 9 000 puces et est deux fois plus économe en énergie que la génération précédente. Cela répond à une préoccupation majeure liée à l’IA générative : sa consommation énergétique massive.
Google ouvre également son vaste réseau mondial d’infrastructure aux clients d’entreprise via Cloud WAN (Réseau étendu). Ce service exploite le réseau de fibre optique de 2 millions de miles de Google, le même qui alimente des services grand public comme YouTube et Gmail.
Selon Google, Cloud WAN peut améliorer les performances réseau jusqu’à 40 % et réduire le coût total de possession du même montant par rapport aux réseaux gérés par les clients. Ce mouvement est inhabituel pour un hyperscaler, transformant essentiellement son infrastructure interne en un produit.
À l’intérieur de Gemini 2.5 : Comment les « modèles pensants » de Google améliorent les applications d’IA pour les entreprises
Sur le front logiciel, Google élargit sa famille de modèles Gemini avec Gemini 2.5 Flash, une version économique de son système d’IA phare qui introduit des « capacités de réflexion ».
Contrairement aux grands modèles de langage traditionnels qui génèrent directement des réponses, ces « modèles pensants » décomposent les problèmes complexes à travers un raisonnement en plusieurs étapes et une autoréflexion. Gemini 2.5 Pro, lancé il y a seulement deux semaines, cible des cas d’utilisation à haute complexité comme la découverte de médicaments et la modélisation financière. La variante Flash récemment annoncée ajuste la profondeur de son raisonnement en fonction de la complexité de la requête pour équilibrer performance et coût.
Google renforce également ses capacités de médias génératifs avec des mises à jour d’Imagen (pour la génération d’images), Veo (vidéo), Chirp (audio), et en introduisant Lyria, un modèle de texte à musique. Lors de la conférence de presse, Nenshad Bardoliwalla, directeur de la gestion de produits pour Vertex AI, a montré comment ces outils peuvent collaborer pour créer une vidéo promotionnelle de concert, complète avec une musique personnalisée et un montage sophistiqué, comme la suppression d’éléments indésirables des clips vidéo.
« Seul Vertex AI réunit tous ces modèles, ainsi que des modèles tiers, sur une seule plateforme », a déclaré Bardoliwalla.
Au-delà des systèmes d’IA uniques : Comment l’écosystème multi-agents de Google vise à améliorer les flux de travail des entreprises
Les annonces les plus visionnaires de Google se concentrent sur la création d’un « écosystème multi-agents », où plusieurs systèmes d’IA peuvent collaborer à travers différentes plateformes et fournisseurs.
Ils introduisent un Kit de Développement d’Agents (ADK) qui permet aux développeurs de construire des systèmes multi-agents avec moins de 100 lignes de code. De plus, Google propose un nouveau protocole ouvert appelé Agent2Agent (A2A), permettant aux agents d’IA de différents fournisseurs de communiquer.
« 2025 sera une année de transition où l’IA générative passera de la réponse à des questions uniques à la résolution de problèmes complexes à travers des systèmes d’agents », a prédit Vahdat.
Plus de 50 partenaires, y compris des fournisseurs majeurs de logiciels d’entreprise comme Salesforce, ServiceNow et SAP, ont signé pour soutenir ce protocole, suggérant un potentiel changement d’industrie vers des systèmes d’IA interopérables.
Pour les utilisateurs non techniques, Google améliore sa plateforme Agent Space avec des fonctionnalités comme Agent Gallery (offrant une vue unique des agents disponibles) et Agent Designer (une interface sans code pour créer des agents personnalisés). Lors d’une démonstration, Google a montré comment un gestionnaire de comptes bancaires pouvait utiliser ces outils pour analyser les portefeuilles des clients, prévoir les problèmes de flux de trésorerie et rédiger automatiquement des communications avec les clients — tout cela sans écrire de code.
Des résumés de documents aux commandes au drive : Comment les agents d’IA spécialisés de Google impactent les industries
Google intègre profondément l’IA dans sa suite de productivité Workspace, introduisant des fonctionnalités comme « Aidez-moi à analyser » dans Sheets, qui identifie automatiquement des insights à partir des données sans formules explicites ni tableaux croisés dynamiques, et des Aperçus Audio dans Docs, qui créent des versions audio de documents semblables à celles d’un humain.
L’entreprise a mis en avant cinq catégories d’agents spécialisés rencontrant une adoption significative : service client, travail créatif, analyse de données, codage et sécurité.
Dans le service client, Google a mentionné le système de drive-through IA de Wendy’s, qui traite désormais 60 000 commandes par jour, et l’agent « Magic Apron » de The Home Depot, qui offre des conseils pour l’amélioration de l’habitat. Pour les équipes créatives, des entreprises comme WPP utilisent l’IA de Google pour conceptualiser et produire des campagnes marketing à grande échelle.
La concurrence dans l’IA cloud s’intensifie : Comment l’approche globale de Google défie Microsoft et Amazon
Les annonces de Google surviennent dans un contexte de compétition croissante dans le domaine de l’IA cloud. Microsoft a profondément intégré la technologie d’OpenAI à travers sa plateforme Azure, tandis qu’Amazon a développé ses propres offres alimentées par Anthropic et des puces spécialisées.
Thomas Kurian, PDG de Google Cloud, a souligné l’engagement de l’entreprise à « fournir une infrastructure, des modèles, des plateformes et des agents de classe mondiale ; offrir une plateforme multi-cloud ouverte qui procure flexibilité et choix ; et construire pour l’interopérabilité. »
Cette approche à multiples facettes semble conçue pour distinguer Google des concurrents qui excellent dans des domaines spécifiques mais manquent de la pile complète, des puces aux applications.
L’avenir de l’IA pour les entreprises : Pourquoi les « modèles pensants » et l’interopérabilité de Google comptent pour la technologie d’entreprise
Ce qui rend les annonces de Google particulièrement significatives est la nature globale de sa stratégie d’IA, couvrant le silicium personnalisé, le réseau mondial, le développement de modèles, les cadres d’agents et l’intégration d’applications.
L’accent mis sur l’optimisation de l’inférence plutôt que sur les seules capacités d’entraînement reflète un marché de l’IA en maturation. Alors que l’entraînement de modèles toujours plus grands a dominé les gros titres, le déploiement efficace de ces modèles à grande échelle devient le défi le plus pressant pour les entreprises.
L’accent mis par Google sur l’interopérabilité — permettant aux systèmes de différents fournisseurs de travailler ensemble — peut signaler un virage loin des approches de jardin clos qui ont caractérisé les premières phases du cloud computing. En proposant des protocoles ouverts comme Agent2Agent, Google se positionne comme le tissu conjonctif dans un écosystème d’IA hétérogène plutôt que d’exiger une adoption tout-ou-rien.
Ces annonces présentent à la fois des opportunités et des défis pour les décideurs techniques d’entreprise. Les gains d’efficacité promis par une infrastructure spécialisée comme les TPU Ironwood et Cloud WAN pourraient réduire considérablement les coûts de déploiement de l’IA à grande échelle. Cependant, naviguer dans le paysage en rapide évolution des modèles, agents et outils nécessitera une planification stratégique minutieuse.
À mesure que ces systèmes d’IA plus sophistiqués continuent de se développer, la capacité à orchestrer plusieurs agents d’IA spécialisés travaillant de concert pourrait devenir le facteur différenciateur clé pour les implémentations d’IA en entreprise. En construisant à la fois les composants et les connexions entre eux, Google parie que l’avenir de l’IA ne concerne pas seulement des machines plus intelligentes, mais des machines qui peuvent communiquer efficacement entre elles.
Article connexe
Google déploie Gemini dans Chrome en Inde
Mercredi, Google a annoncé l'extension de l'intégration de Gemini dans Chrome à de nouvelles régions, notamment l'Inde, le Canada et la Nouvelle-Zélande. Ce déploiement permet aux utilisateurs d'ordin
YouTube étend sa détection des deepfakes par IA aux personnalités politiques, aux responsables gouvernementaux et aux journalistes
Mardi, YouTube a annoncé qu’il étendait sa technologie de détection des deepfakes à un groupe restreint de responsables gouvernementaux, de candidats politiques et de journalistes. Cet outil identifie
YouTube teste une fonctionnalité de recherche basée sur l'IA proposant des réponses guidées
De nombreux utilisateurs se tournent vers YouTube lorsqu'ils recherchent des recettes ou des itinéraires de voyage, à la recherche de vidéos pertinentes. Aujourd'hui, la plateforme lance un outil de r
Recommandations de sujets spéciaux liés
commentaires (41)
Die neuen KI-Chips von Google klingen beeindruckend, aber ich frage mich, ob das wirklich den Preis für Cloud-Dienste senken wird oder ob es nur die Gewinnmargen erhöht. Die 'Agenten'-Ökosysteme erinnern mich an die alten App-Stores – wird das am Ende auch so fragmentiert und überladen? 🧐 Trotzdem, spannend zu sehen, wie der Wettkampf mit Microsoft und Amazon die Innovation vorantreibt. Hoffentlich bleibt dabei die Nutzerkontrolle nicht auf der Strecke.
This agent ecosystem stuff is interesting, but I'm a bit concerned about how much control we'll have over these "smart" assistants. The whole "specialized infrastructure" angle feels a lot like Google trying to build a walled garden for AI development. Will this lock developers in more than it helps them innovate? 🤔
Google's new AI chips sound like a game-changer! Can't wait to see how they stack up against Microsoft and Amazon in real-world apps. 🤖 Anyone else hyped for this tech showdown?
Google's new AI chips sound like a game-changer! Curious how they'll stack up against Microsoft's Azure in real-world apps. 🚀
Google's new AI chips sound like a game-changer! Curious how they'll stack up against Microsoft's Azure in real-world use. 🤔

Google Cloud fait de grands pas pour consolider sa position dans le monde extrêmement compétitif de l’intelligence artificielle. Lors de la conférence annuelle Cloud Next à Las Vegas, ils ont dévoilé une suite de nouvelles technologies centrées sur les « modèles pensants », les écosystèmes d’agents et une infrastructure spécialisée adaptée aux déploiements massifs d’IA.
La vedette du spectacle était l’unité de traitement tensoriel (TPU) de septième génération, surnommée Ironwood. Google se vante qu’elle offre plus de 42 exaflops de puissance de calcul par pod, ce qui est incroyablement 24 fois plus puissant que le superordinateur de pointe, El Capitan.
« L’opportunité avec l’IA est aussi grande qu’elle peut l’être », a déclaré Amin Vahdat, vice-président de Google et directeur général des systèmes ML et de l’IA cloud, lors d’une conférence de presse préalable à l’événement. « Ensemble avec nos clients, nous propulsons une nouvelle ère dorée d’innovation. »
L’activité cloud de Google bénéficie d’un élan considérable. En janvier, ils ont rapporté un chiffre d’affaires cloud de 12 milliards de dollars pour le quatrième trimestre 2024, soit une augmentation de 30 % par rapport à l’année précédente. L’entreprise a également noté une augmentation de 80 % des utilisateurs actifs sur AI Studio et l’API Gemini au cours du dernier mois.
Comment les nouveaux TPU Ironwood de Google transforment le calcul de l’IA avec une efficacité énergétique
Google se positionne comme le seul grand fournisseur de cloud avec une « plateforme entièrement optimisée pour l’IA », conçue de toutes pièces pour ce qu’ils appellent « l’ère de l’inférence ». Ce changement met l’accent sur l’utilisation des systèmes d’IA pour résoudre des problèmes réels plutôt que de simplement entraîner des modèles.
Ironwood représente un changement significatif dans la philosophie de conception des puces. Contrairement à ses prédécesseurs, qui équilibrent l’entraînement et l’inférence, Ironwood est spécifiquement conçu pour exécuter des modèles d’IA complexes après l’entraînement.
« Il ne s’agit plus des données insérées dans le modèle, mais de ce que le modèle peut faire avec les données après avoir été entraîné », a expliqué Vahdat.
Chaque pod Ironwood contient plus de 9 000 puces et est deux fois plus économe en énergie que la génération précédente. Cela répond à une préoccupation majeure liée à l’IA générative : sa consommation énergétique massive.
Google ouvre également son vaste réseau mondial d’infrastructure aux clients d’entreprise via Cloud WAN (Réseau étendu). Ce service exploite le réseau de fibre optique de 2 millions de miles de Google, le même qui alimente des services grand public comme YouTube et Gmail.
Selon Google, Cloud WAN peut améliorer les performances réseau jusqu’à 40 % et réduire le coût total de possession du même montant par rapport aux réseaux gérés par les clients. Ce mouvement est inhabituel pour un hyperscaler, transformant essentiellement son infrastructure interne en un produit.
À l’intérieur de Gemini 2.5 : Comment les « modèles pensants » de Google améliorent les applications d’IA pour les entreprises
Sur le front logiciel, Google élargit sa famille de modèles Gemini avec Gemini 2.5 Flash, une version économique de son système d’IA phare qui introduit des « capacités de réflexion ».
Contrairement aux grands modèles de langage traditionnels qui génèrent directement des réponses, ces « modèles pensants » décomposent les problèmes complexes à travers un raisonnement en plusieurs étapes et une autoréflexion. Gemini 2.5 Pro, lancé il y a seulement deux semaines, cible des cas d’utilisation à haute complexité comme la découverte de médicaments et la modélisation financière. La variante Flash récemment annoncée ajuste la profondeur de son raisonnement en fonction de la complexité de la requête pour équilibrer performance et coût.
Google renforce également ses capacités de médias génératifs avec des mises à jour d’Imagen (pour la génération d’images), Veo (vidéo), Chirp (audio), et en introduisant Lyria, un modèle de texte à musique. Lors de la conférence de presse, Nenshad Bardoliwalla, directeur de la gestion de produits pour Vertex AI, a montré comment ces outils peuvent collaborer pour créer une vidéo promotionnelle de concert, complète avec une musique personnalisée et un montage sophistiqué, comme la suppression d’éléments indésirables des clips vidéo.
« Seul Vertex AI réunit tous ces modèles, ainsi que des modèles tiers, sur une seule plateforme », a déclaré Bardoliwalla.
Au-delà des systèmes d’IA uniques : Comment l’écosystème multi-agents de Google vise à améliorer les flux de travail des entreprises
Les annonces les plus visionnaires de Google se concentrent sur la création d’un « écosystème multi-agents », où plusieurs systèmes d’IA peuvent collaborer à travers différentes plateformes et fournisseurs.
Ils introduisent un Kit de Développement d’Agents (ADK) qui permet aux développeurs de construire des systèmes multi-agents avec moins de 100 lignes de code. De plus, Google propose un nouveau protocole ouvert appelé Agent2Agent (A2A), permettant aux agents d’IA de différents fournisseurs de communiquer.
« 2025 sera une année de transition où l’IA générative passera de la réponse à des questions uniques à la résolution de problèmes complexes à travers des systèmes d’agents », a prédit Vahdat.
Plus de 50 partenaires, y compris des fournisseurs majeurs de logiciels d’entreprise comme Salesforce, ServiceNow et SAP, ont signé pour soutenir ce protocole, suggérant un potentiel changement d’industrie vers des systèmes d’IA interopérables.
Pour les utilisateurs non techniques, Google améliore sa plateforme Agent Space avec des fonctionnalités comme Agent Gallery (offrant une vue unique des agents disponibles) et Agent Designer (une interface sans code pour créer des agents personnalisés). Lors d’une démonstration, Google a montré comment un gestionnaire de comptes bancaires pouvait utiliser ces outils pour analyser les portefeuilles des clients, prévoir les problèmes de flux de trésorerie et rédiger automatiquement des communications avec les clients — tout cela sans écrire de code.
Des résumés de documents aux commandes au drive : Comment les agents d’IA spécialisés de Google impactent les industries
Google intègre profondément l’IA dans sa suite de productivité Workspace, introduisant des fonctionnalités comme « Aidez-moi à analyser » dans Sheets, qui identifie automatiquement des insights à partir des données sans formules explicites ni tableaux croisés dynamiques, et des Aperçus Audio dans Docs, qui créent des versions audio de documents semblables à celles d’un humain.
L’entreprise a mis en avant cinq catégories d’agents spécialisés rencontrant une adoption significative : service client, travail créatif, analyse de données, codage et sécurité.
Dans le service client, Google a mentionné le système de drive-through IA de Wendy’s, qui traite désormais 60 000 commandes par jour, et l’agent « Magic Apron » de The Home Depot, qui offre des conseils pour l’amélioration de l’habitat. Pour les équipes créatives, des entreprises comme WPP utilisent l’IA de Google pour conceptualiser et produire des campagnes marketing à grande échelle.
La concurrence dans l’IA cloud s’intensifie : Comment l’approche globale de Google défie Microsoft et Amazon
Les annonces de Google surviennent dans un contexte de compétition croissante dans le domaine de l’IA cloud. Microsoft a profondément intégré la technologie d’OpenAI à travers sa plateforme Azure, tandis qu’Amazon a développé ses propres offres alimentées par Anthropic et des puces spécialisées.
Thomas Kurian, PDG de Google Cloud, a souligné l’engagement de l’entreprise à « fournir une infrastructure, des modèles, des plateformes et des agents de classe mondiale ; offrir une plateforme multi-cloud ouverte qui procure flexibilité et choix ; et construire pour l’interopérabilité. »
Cette approche à multiples facettes semble conçue pour distinguer Google des concurrents qui excellent dans des domaines spécifiques mais manquent de la pile complète, des puces aux applications.
L’avenir de l’IA pour les entreprises : Pourquoi les « modèles pensants » et l’interopérabilité de Google comptent pour la technologie d’entreprise
Ce qui rend les annonces de Google particulièrement significatives est la nature globale de sa stratégie d’IA, couvrant le silicium personnalisé, le réseau mondial, le développement de modèles, les cadres d’agents et l’intégration d’applications.
L’accent mis sur l’optimisation de l’inférence plutôt que sur les seules capacités d’entraînement reflète un marché de l’IA en maturation. Alors que l’entraînement de modèles toujours plus grands a dominé les gros titres, le déploiement efficace de ces modèles à grande échelle devient le défi le plus pressant pour les entreprises.
L’accent mis par Google sur l’interopérabilité — permettant aux systèmes de différents fournisseurs de travailler ensemble — peut signaler un virage loin des approches de jardin clos qui ont caractérisé les premières phases du cloud computing. En proposant des protocoles ouverts comme Agent2Agent, Google se positionne comme le tissu conjonctif dans un écosystème d’IA hétérogène plutôt que d’exiger une adoption tout-ou-rien.
Ces annonces présentent à la fois des opportunités et des défis pour les décideurs techniques d’entreprise. Les gains d’efficacité promis par une infrastructure spécialisée comme les TPU Ironwood et Cloud WAN pourraient réduire considérablement les coûts de déploiement de l’IA à grande échelle. Cependant, naviguer dans le paysage en rapide évolution des modèles, agents et outils nécessitera une planification stratégique minutieuse.
À mesure que ces systèmes d’IA plus sophistiqués continuent de se développer, la capacité à orchestrer plusieurs agents d’IA spécialisés travaillant de concert pourrait devenir le facteur différenciateur clé pour les implémentations d’IA en entreprise. En construisant à la fois les composants et les connexions entre eux, Google parie que l’avenir de l’IA ne concerne pas seulement des machines plus intelligentes, mais des machines qui peuvent communiquer efficacement entre elles.
Google déploie Gemini dans Chrome en Inde
Mercredi, Google a annoncé l'extension de l'intégration de Gemini dans Chrome à de nouvelles régions, notamment l'Inde, le Canada et la Nouvelle-Zélande. Ce déploiement permet aux utilisateurs d'ordin
YouTube étend sa détection des deepfakes par IA aux personnalités politiques, aux responsables gouvernementaux et aux journalistes
Mardi, YouTube a annoncé qu’il étendait sa technologie de détection des deepfakes à un groupe restreint de responsables gouvernementaux, de candidats politiques et de journalistes. Cet outil identifie
YouTube teste une fonctionnalité de recherche basée sur l'IA proposant des réponses guidées
De nombreux utilisateurs se tournent vers YouTube lorsqu'ils recherchent des recettes ou des itinéraires de voyage, à la recherche de vidéos pertinentes. Aujourd'hui, la plateforme lance un outil de r
Die neuen KI-Chips von Google klingen beeindruckend, aber ich frage mich, ob das wirklich den Preis für Cloud-Dienste senken wird oder ob es nur die Gewinnmargen erhöht. Die 'Agenten'-Ökosysteme erinnern mich an die alten App-Stores – wird das am Ende auch so fragmentiert und überladen? 🧐 Trotzdem, spannend zu sehen, wie der Wettkampf mit Microsoft und Amazon die Innovation vorantreibt. Hoffentlich bleibt dabei die Nutzerkontrolle nicht auf der Strecke.
This agent ecosystem stuff is interesting, but I'm a bit concerned about how much control we'll have over these "smart" assistants. The whole "specialized infrastructure" angle feels a lot like Google trying to build a walled garden for AI development. Will this lock developers in more than it helps them innovate? 🤔
Google's new AI chips sound like a game-changer! Can't wait to see how they stack up against Microsoft and Amazon in real-world apps. 🤖 Anyone else hyped for this tech showdown?
Google's new AI chips sound like a game-changer! Curious how they'll stack up against Microsoft's Azure in real-world apps. 🚀
Google's new AI chips sound like a game-changer! Curious how they'll stack up against Microsoft's Azure in real-world use. 🤔











