Google Cloud Next '25: les nouvelles puces AI et l'écosystème d'agent défisnt Microsoft et Amazon

Maison

Nouvelles

17 avril 2025

WillGarcía

# Google # nlp # ai-agent # ironwood # tpu # tpus

Google Cloud Next '25: les nouvelles puces AI et l'écosystème d'agent défisnt Microsoft et Amazon

Google Cloud fait de grands pas pour consolider sa position dans le monde extrêmement compétitif de l’intelligence artificielle. Lors de la conférence annuelle Cloud Next à Las Vegas, ils ont dévoilé une suite de nouvelles technologies centrées sur les « modèles pensants », les écosystèmes d’agents et une infrastructure spécialisée adaptée aux déploiements massifs d’IA.

La vedette du spectacle était l’unité de traitement tensoriel (TPU) de septième génération, surnommée Ironwood. Google se vante qu’elle offre plus de 42 exaflops de puissance de calcul par pod, ce qui est incroyablement 24 fois plus puissant que le superordinateur de pointe, El Capitan.

« L’opportunité avec l’IA est aussi grande qu’elle peut l’être », a déclaré Amin Vahdat, vice-président de Google et directeur général des systèmes ML et de l’IA cloud, lors d’une conférence de presse préalable à l’événement. « Ensemble avec nos clients, nous propulsons une nouvelle ère dorée d’innovation. »

L’activité cloud de Google bénéficie d’un élan considérable. En janvier, ils ont rapporté un chiffre d’affaires cloud de 12 milliards de dollars pour le quatrième trimestre 2024, soit une augmentation de 30 % par rapport à l’année précédente. L’entreprise a également noté une augmentation de 80 % des utilisateurs actifs sur AI Studio et l’API Gemini au cours du dernier mois.

Comment les nouveaux TPU Ironwood de Google transforment le calcul de l’IA avec une efficacité énergétique

Google se positionne comme le seul grand fournisseur de cloud avec une « plateforme entièrement optimisée pour l’IA », conçue de toutes pièces pour ce qu’ils appellent « l’ère de l’inférence ». Ce changement met l’accent sur l’utilisation des systèmes d’IA pour résoudre des problèmes réels plutôt que de simplement entraîner des modèles.

Ironwood représente un changement significatif dans la philosophie de conception des puces. Contrairement à ses prédécesseurs, qui équilibrent l’entraînement et l’inférence, Ironwood est spécifiquement conçu pour exécuter des modèles d’IA complexes après l’entraînement.

« Il ne s’agit plus des données insérées dans le modèle, mais de ce que le modèle peut faire avec les données après avoir été entraîné », a expliqué Vahdat.

Chaque pod Ironwood contient plus de 9 000 puces et est deux fois plus économe en énergie que la génération précédente. Cela répond à une préoccupation majeure liée à l’IA générative : sa consommation énergétique massive.

Google ouvre également son vaste réseau mondial d’infrastructure aux clients d’entreprise via Cloud WAN (Réseau étendu). Ce service exploite le réseau de fibre optique de 2 millions de miles de Google, le même qui alimente des services grand public comme YouTube et Gmail.

Selon Google, Cloud WAN peut améliorer les performances réseau jusqu’à 40 % et réduire le coût total de possession du même montant par rapport aux réseaux gérés par les clients. Ce mouvement est inhabituel pour un hyperscaler, transformant essentiellement son infrastructure interne en un produit.

À l’intérieur de Gemini 2.5 : Comment les « modèles pensants » de Google améliorent les applications d’IA pour les entreprises

Sur le front logiciel, Google élargit sa famille de modèles Gemini avec Gemini 2.5 Flash, une version économique de son système d’IA phare qui introduit des « capacités de réflexion ».

Contrairement aux grands modèles de langage traditionnels qui génèrent directement des réponses, ces « modèles pensants » décomposent les problèmes complexes à travers un raisonnement en plusieurs étapes et une autoréflexion. Gemini 2.5 Pro, lancé il y a seulement deux semaines, cible des cas d’utilisation à haute complexité comme la découverte de médicaments et la modélisation financière. La variante Flash récemment annoncée ajuste la profondeur de son raisonnement en fonction de la complexité de la requête pour équilibrer performance et coût.

Google renforce également ses capacités de médias génératifs avec des mises à jour d’Imagen (pour la génération d’images), Veo (vidéo), Chirp (audio), et en introduisant Lyria, un modèle de texte à musique. Lors de la conférence de presse, Nenshad Bardoliwalla, directeur de la gestion de produits pour Vertex AI, a montré comment ces outils peuvent collaborer pour créer une vidéo promotionnelle de concert, complète avec une musique personnalisée et un montage sophistiqué, comme la suppression d’éléments indésirables des clips vidéo.

« Seul Vertex AI réunit tous ces modèles, ainsi que des modèles tiers, sur une seule plateforme », a déclaré Bardoliwalla.

Au-delà des systèmes d’IA uniques : Comment l’écosystème multi-agents de Google vise à améliorer les flux de travail des entreprises

Les annonces les plus visionnaires de Google se concentrent sur la création d’un « écosystème multi-agents », où plusieurs systèmes d’IA peuvent collaborer à travers différentes plateformes et fournisseurs.

Ils introduisent un Kit de Développement d’Agents (ADK) qui permet aux développeurs de construire des systèmes multi-agents avec moins de 100 lignes de code. De plus, Google propose un nouveau protocole ouvert appelé Agent2Agent (A2A), permettant aux agents d’IA de différents fournisseurs de communiquer.

« 2025 sera une année de transition où l’IA générative passera de la réponse à des questions uniques à la résolution de problèmes complexes à travers des systèmes d’agents », a prédit Vahdat.

Plus de 50 partenaires, y compris des fournisseurs majeurs de logiciels d’entreprise comme Salesforce, ServiceNow et SAP, ont signé pour soutenir ce protocole, suggérant un potentiel changement d’industrie vers des systèmes d’IA interopérables.

Pour les utilisateurs non techniques, Google améliore sa plateforme Agent Space avec des fonctionnalités comme Agent Gallery (offrant une vue unique des agents disponibles) et Agent Designer (une interface sans code pour créer des agents personnalisés). Lors d’une démonstration, Google a montré comment un gestionnaire de comptes bancaires pouvait utiliser ces outils pour analyser les portefeuilles des clients, prévoir les problèmes de flux de trésorerie et rédiger automatiquement des communications avec les clients — tout cela sans écrire de code.

Des résumés de documents aux commandes au drive : Comment les agents d’IA spécialisés de Google impactent les industries

Google intègre profondément l’IA dans sa suite de productivité Workspace, introduisant des fonctionnalités comme « Aidez-moi à analyser » dans Sheets, qui identifie automatiquement des insights à partir des données sans formules explicites ni tableaux croisés dynamiques, et des Aperçus Audio dans Docs, qui créent des versions audio de documents semblables à celles d’un humain.

L’entreprise a mis en avant cinq catégories d’agents spécialisés rencontrant une adoption significative : service client, travail créatif, analyse de données, codage et sécurité.

Dans le service client, Google a mentionné le système de drive-through IA de Wendy’s, qui traite désormais 60 000 commandes par jour, et l’agent « Magic Apron » de The Home Depot, qui offre des conseils pour l’amélioration de l’habitat. Pour les équipes créatives, des entreprises comme WPP utilisent l’IA de Google pour conceptualiser et produire des campagnes marketing à grande échelle.

La concurrence dans l’IA cloud s’intensifie : Comment l’approche globale de Google défie Microsoft et Amazon

Les annonces de Google surviennent dans un contexte de compétition croissante dans le domaine de l’IA cloud. Microsoft a profondément intégré la technologie d’OpenAI à travers sa plateforme Azure, tandis qu’Amazon a développé ses propres offres alimentées par Anthropic et des puces spécialisées.

Thomas Kurian, PDG de Google Cloud, a souligné l’engagement de l’entreprise à « fournir une infrastructure, des modèles, des plateformes et des agents de classe mondiale ; offrir une plateforme multi-cloud ouverte qui procure flexibilité et choix ; et construire pour l’interopérabilité. »

Cette approche à multiples facettes semble conçue pour distinguer Google des concurrents qui excellent dans des domaines spécifiques mais manquent de la pile complète, des puces aux applications.

L’avenir de l’IA pour les entreprises : Pourquoi les « modèles pensants » et l’interopérabilité de Google comptent pour la technologie d’entreprise

Ce qui rend les annonces de Google particulièrement significatives est la nature globale de sa stratégie d’IA, couvrant le silicium personnalisé, le réseau mondial, le développement de modèles, les cadres d’agents et l’intégration d’applications.

L’accent mis sur l’optimisation de l’inférence plutôt que sur les seules capacités d’entraînement reflète un marché de l’IA en maturation. Alors que l’entraînement de modèles toujours plus grands a dominé les gros titres, le déploiement efficace de ces modèles à grande échelle devient le défi le plus pressant pour les entreprises.

L’accent mis par Google sur l’interopérabilité — permettant aux systèmes de différents fournisseurs de travailler ensemble — peut signaler un virage loin des approches de jardin clos qui ont caractérisé les premières phases du cloud computing. En proposant des protocoles ouverts comme Agent2Agent, Google se positionne comme le tissu conjonctif dans un écosystème d’IA hétérogène plutôt que d’exiger une adoption tout-ou-rien.

Ces annonces présentent à la fois des opportunités et des défis pour les décideurs techniques d’entreprise. Les gains d’efficacité promis par une infrastructure spécialisée comme les TPU Ironwood et Cloud WAN pourraient réduire considérablement les coûts de déploiement de l’IA à grande échelle. Cependant, naviguer dans le paysage en rapide évolution des modèles, agents et outils nécessitera une planification stratégique minutieuse.

À mesure que ces systèmes d’IA plus sophistiqués continuent de se développer, la capacité à orchestrer plusieurs agents d’IA spécialisés travaillant de concert pourrait devenir le facteur différenciateur clé pour les implémentations d’IA en entreprise. En construisant à la fois les composants et les connexions entre eux, Google parie que l’avenir de l’IA ne concerne pas seulement des machines plus intelligentes, mais des machines qui peuvent communiquer efficacement entre elles.

Article connexe

Google dévoile les modèles AI Gemini 2.5 prêts pour la production pour rivaliser avec OpenAI sur le marché des entreprises Google a intensifié sa stratégie AI lundi, lançant ses modèles avancés Gemini 2.5 pour une utilisation en entreprise et introduisant une variante économique pour concurrencer sur le prix et la perform

Google Dévoile l’Outil Simplifier Propulsé par l’IA pour une Lecture Web Plus Facile L’application iOS de Google inclut désormais une fonctionnalité « Simplifier », exploitant l’IA pour transformer les textes complexes du web en contenu clair et compréhensible sans quitter la page.L’o

Google Cloud Améliore les Outils Multimédias IA avec de Nouvelles Fonctionnalités Musicales et Vidéo Mercredi, Google a dévoilé des améliorations de sa plateforme cloud Vertex AI, renforçant plusieurs modèles d'IA propriétaires pour la génération de contenus multimédias.Lyria, l'IA de Google pour la

commentaires (35)

0/200

Soumettre

WillieHernández

19 avril 2025 07:33:55 UTC+02:00

Google Cloud Next '25の新しいAIチップとエージェントエコシステムは素晴らしい！マイクロソフトやアマゾンに挑戦状を叩きつけた感じですね。ただ、「思考モデル」がどう機能するのか、もう少し説明が欲しかったです。😅それでも期待が高まります！

EricRoberts

19 avril 2025 06:26:32 UTC+02:00

Google Cloud Next '25에서 새로 공개된 AI 칩과 에이전트 생태계 정말 대단해요! 마치 마이크로소프트와 아마존에 도전장을 내민 것 같아요. 그런데 '생각 모델'이 어떻게 작동하는지 더 설명해줬으면 좋겠어요. 😕 그래도 기대가 커요!

BillyThomas

19 avril 2025 03:21:09 UTC+02:00

¡Los nuevos chips de IA y el ecosistema de agentes de Google Cloud están revolucionando todo! Estoy emocionado de ver cómo desafían a Microsoft y Amazon. Los 'modelos de pensamiento' suenan súper innovadores, pero me preocupa un poco la curva de aprendizaje. ¡No puedo esperar para probarlo! 😃

GeorgeWilson

19 avril 2025 00:21:34 UTC+02:00

구글 클라우드의 새로운 AI 칩과 에이전트 생태계, 정말 멋지네요! 마이크로소프트와 아마존에 도전하는 거 너무 기대돼요. '생각 모델'도 혁신적이지만, 배우는 데 시간이 걸릴 것 같아요. 빨리 사용해보고 싶어요! 😄

RyanAdams

18 avril 2025 23:24:18 UTC+02:00

Os novos chips de IA e o ecossistema de agentes da Google Cloud estão mudando tudo! Estou animado para ver como eles desafiam a Microsoft e a Amazon. Os 'modelos de pensamento' parecem super inovadores, mas estou um pouco preocupado com a curva de aprendizado. Mal posso esperar para experimentar! 😎

JoseGonzalez

18 avril 2025 22:41:45 UTC+02:00

Google Cloud Next '25 really stepped up their game with these new AI chips and agent ecosystems! It's like they're throwing down the gauntlet to Microsoft and Amazon. I'm excited to see how this plays out, but I wish they'd explained more about how these 'thinking models' work. 🤔 Still, it's a promising start!

Top nouvelles

Gemini 2.5 Pro maintenant illimité et moins cher que Claude, GPT-4O Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives OpenAI améliore l'assistant vocal AI pour de meilleurs chats Notebooklm se développe à l'échelle mondiale, ajoute des diapositives et une vérification des faits améliorée Doublage par IA : Guide ultime pour la création de voix réalistes Les ajustements aux centres de données américains pourraient débloquer 76 GW de nouvelle capacité d'énergie L'informatique de l'IA pour consommer la puissance de plusieurs New York d'ici 2026, explique le fondateur Clonage Vocal IA: Guide Ultime pour Maîtriser la Conversion de Voix Découvrez les mots croisés d'E / S propulsés par l'IA: une touche moderne sur le jeu de mots classique Le PDG de Nvidia clarifie les idées fausses sur l'impact du marché de Deepseek

Plus

En vedette