option
Maison Nouvelles Google Cloud Next '25: les nouvelles puces AI et l'écosystème d'agent défisnt Microsoft et Amazon

Google Cloud Next '25: les nouvelles puces AI et l'écosystème d'agent défisnt Microsoft et Amazon

date de sortie date de sortie 16 avril 2025
Auteur Auteur WillGarcía
vues vues 45

Google Cloud Next '25: les nouvelles puces AI et l'écosystème d'agent défisnt Microsoft et Amazon

Google Cloud fait de grandes mouvements pour cimenter sa place dans le monde farouchement compétitif de l'intelligence artificielle. Lors de la conférence annuelle Cloud Next à Las Vegas, ils ont dévoilé une suite de nouvelles technologies centrées sur des «modèles de réflexion», des écosystèmes d'agent et des infrastructures spécialisées adaptées aux déploiements d'IA massifs.

La star du spectacle était l'unité de traitement du tenseur de septième génération (TPU), surnommée Ironwood. Google se vante qu'il délivre plus de 42 exaflops de puissance de calcul par pod, ce qui est un 24 fois plus puissant que le supercalculateur leader, El Capitan.

"L'opportunité avec l'IA est aussi grande que possible", s'est exclamé Amin Vahdat, vice-président et directeur général de Google de ML Systems and Cloud AI, lors d'une conférence de presse avant l'événement. «Avec nos clients, nous alimentons un nouvel âge d'or de l'innovation.»

Les activités cloud de Google surveillent une vague d'élan. En janvier, ils ont annoncé un chiffre d'affaires cloud du 4 2024 de 12 milliards de dollars, un bond à 30% par rapport à l'année précédente. La société a également noté une augmentation de 80% des utilisateurs actifs sur AI Studio et l'API Gemini au cours du mois dernier.

Comment les nouveaux TPU à Ironwood de Google transforment l'informatique AI avec une efficacité électrique

Google se positionne comme le seul principal fournisseur de cloud avec une "plate-forme entièrement optimisée", conçue à partir de zéro pour ce qu'ils appellent "l'âge de l'inférence". Ce changement se concentre sur l'utilisation des systèmes d'IA pour s'attaquer aux problèmes du monde réel plutôt qu'à des modèles de formation.

Ironwood représente un changement significatif dans la philosophie de conception des puces. Contrairement à ses prédécesseurs, qui ont équilibré l'entraînement et l'inférence, Ironwood est spécifiquement conçu pour exécuter des modèles d'IA complexes après la formation.

"Il ne s'agit plus des données placées dans le modèle, mais ce que le modèle peut faire avec les données après sa formation", a expliqué Vahdat.

Chaque pod Ironwood contient plus de 9 000 puces et est deux fois plus économe en puissance que la génération précédente. Cela répond à une préoccupation majeure de l'IA générative: sa consommation d'énergie massive.

Google ouvre également sa vaste infrastructure de réseau mondial aux clients d'entreprise via Cloud WAN (Wide Area Network). Ce service s'appuie sur le réseau de fibres de 2 millions de milles de Google, le même qui alimente les services de consommation comme YouTube et Gmail.

Selon Google, Cloud WAN peut augmenter les performances du réseau jusqu'à 40% et réduire le coût total de possession du même montant par rapport aux réseaux gérés par les clients. Cette décision est inhabituelle pour un hyperscaleur, transformant essentiellement son infrastructure interne en produit.

Inside Gemini 2.5: comment les «modèles de réflexion» de Google améliorent les applications de l'IA d'entreprise

Sur le plan du logiciel, Google étend sa famille de modèles Gemini avec Gemini 2.5 Flash, une version rentable de son système d'IA phare qui introduit des «capacités de pensée».

Contrairement aux modèles traditionnels de grand langage qui génèrent directement des réponses, ces «modèles de réflexion» décomposent des problèmes complexes grâce à un raisonnement en plusieurs étapes et à l'auto-réflexion. Gemini 2.5 Pro, lancé il y a seulement deux semaines, cible des cas d'utilisation à haute complexité comme la découverte de médicaments et la modélisation financière. La variante flash nouvellement annoncée ajuste sa profondeur de raisonnement en fonction de la complexité rapide pour équilibrer les performances et les coûts.

Google renforce également ses capacités médiatiques génératives avec des mises à jour vers Imagen (pour la génération d'images), Veo (vidéo), Chirp (Audio) et l'introduction de Lyria, un modèle de texte à musique. Au cours de la conférence de presse, Nenshad Bardoliwalla, directeur de la gestion des produits pour Vertex IA, a montré comment ces outils peuvent collaborer pour créer une vidéo de concert promotionnelle, avec de la musique personnalisée et une modification sophistiquée comme la suppression des éléments indésirables des clips vidéo.

"Seul le sommet AI rassemble tous ces modèles, ainsi que des modèles tiers sur une seule plate-forme", a déclaré Bardoliwalla.

Au-delà des systèmes d'IA unique: comment l'écosystème multi-agent de Google vise à améliorer les workflows d'entreprise

Les annonces les plus prospectives de Google se concentrent sur la création d'un «écosystème multi-agents», où plusieurs systèmes d'IA peuvent collaborer sur différentes plates-formes et fournisseurs.

Ils introduisent un kit de développement d'agent (ADK) qui permet aux développeurs de construire des systèmes multi-agents avec moins de 100 lignes de code. De plus, Google propose un nouveau protocole ouvert appelé agent2agent (A2A), permettant aux agents d'IA de différents fournisseurs de communiquer.

«2025 sera une année de transition où une IA générative passe de la réponse à des questions uniques à la résolution de problèmes complexes à travers des systèmes agents», a prédit Vahdat.

Plus de 50 partenaires, dont les principaux fournisseurs de logiciels d'entreprise comme Salesforce, ServiceNow et SAP, ont signé pour soutenir ce protocole, suggérant un changement potentiel de l'industrie vers des systèmes d'IA interopérables.

Pour les utilisateurs non techniques, Google améliore sa plate-forme d'espace d'agent avec des fonctionnalités telles que Agent Gallery (offrant une seule vue des agents disponibles) et un concepteur d'agent (une interface sans code pour créer des agents personnalisés). Au cours d'une démonstration, Google a montré comment un gestionnaire de compte bancaire pouvait utiliser ces outils pour analyser les portefeuilles clients, prévoir les problèmes de flux de trésorerie et rédiger automatiquement les communications clients - le tout sans écrire de code.

Des résumés de documents aux commandes au volant: comment les agents d'IA spécialisés de Google affectent les industries

Google intègre profondément l'IA dans sa suite de productivité d'espace de travail, introduisant des fonctionnalités telles que "Aidez-moi analyser" dans les feuilles, qui identifie automatiquement les informations à partir de données sans formules explicites ou tables de pivot, et des aperçus audio dans les documents, qui créent des versions audio de type humain de documents.

La société a mis en évidence cinq catégories d'agents spécialisés en voyant une adoption importante: le service client, le travail créatif, l'analyse des données, le codage et la sécurité.

Dans le service à la clientèle, Google a souligné le système d'administration de l'IA de Wendy, qui gère désormais 60 000 commandes par jour, et l'agent «Magic Apron» du Home Depot, qui propose des conseils d'amélioration de la maison. Pour les équipes créatives, des entreprises comme WPP utilisent l'IA de Google pour conceptualiser et produire des campagnes de marketing à grande échelle.

La concurrence de Cloud AI s'intensifie: comment l'approche complète de Google remet en question Microsoft et Amazon

Les annonces de Google interviennent dans l'intensification de la concurrence dans l'espace Cloud AI. Microsoft a profondément intégré la technologie d'Openai sur sa plate-forme Azure, tandis qu'Amazon a construit ses propres offres anthropiques et puces spécialisées.

Thomas Kurian, PDG de Google Cloud, a souligné «l'engagement de l'entreprise à fournir une infrastructure, des modèles, des plateformes et des agents de classe mondiale; offrant une plate-forme ouverte et multi-cloud qui offre de la flexibilité et du choix; et de la construction à l'interopérabilité.»

Cette approche à plusieurs volets semble conçue pour distinguer Google des concurrents qui peuvent exceller dans des domaines spécifiques mais n'ont pas la pile complète des puces aux applications.

L'avenir de l'entreprise AI: pourquoi les «modèles de réflexion» de Google et l'interopérabilité sont importants pour la technologie commerciale

Ce qui rend les annonces de Google particulièrement importantes, c'est la nature complète de sa stratégie d'IA, couvrant le silicium personnalisé, le réseautage mondial, le développement de modèles, les cadres d'agent et l'intégration des applications.

L'accent mis sur l'optimisation des inférences plutôt que sur les simples capacités de formation reflète un marché d'IA en maturation. Alors que la formation des modèles toujours plus las a dominé les gros titres, le déploiement de ces modèles efficacement à grande échelle devient le défi le plus urgent pour les entreprises.

L'accent mis par Google sur l'interopérabilité - permettant aux systèmes de différents fournisseurs de travailler ensemble - peut signaler un éloignement des approches de jardin clos qui ont caractérisé les phases antérieures du cloud computing. En proposant des protocoles ouverts comme Agent2Agent, Google se positionne comme le tissu connectif dans un écosystème d'IA hétérogène plutôt que d'exiger l'adoption tout ou rien.

Ces annonces présentent à la fois des opportunités et des défis pour les décideurs techniques d'entreprise. Les gains d'efficacité promis par des infrastructures spécialisées comme Ironwood TPU et Cloud WAN pourraient réduire considérablement les coûts de déploiement de l'IA à grande échelle. Cependant, naviguer dans le paysage rapide en évolution des modèles, des agents et des outils nécessitera une planification stratégique minutieuse.

Alors que ces systèmes d'IA plus sophistiqués continuent de se développer, la capacité d'orchestrer plusieurs agents d'IA spécialisés travaillant en concert peut devenir le principal différenciateur des implémentations d'IA d'entreprise. En construisant à la fois les composants et les connexions entre eux, Google parie que l'avenir de l'IA n'est pas seulement une question de machines plus intelligentes, mais de machines qui peuvent communiquer efficacement entre elles.

Article connexe
Former DeepSeeker and collaborators release new method for training reliable AI agents: RAGEN Former DeepSeeker and collaborators release new method for training reliable AI agents: RAGEN The Year of AI Agents: A Closer Look at 2025's Expectations and Realities2025 was heralded by many experts as the year when AI agents—specialized AI systems powered by advanced large language and multimodal models from companies like OpenAI, Anthropic, Google, and DeepSeek—would finally take center
GAIA Introduces New Benchmark in Quest for True Intelligence Beyond ARC-AGI GAIA Introduces New Benchmark in Quest for True Intelligence Beyond ARC-AGI Intelligence is everywhere, yet gauging it accurately feels like trying to catch a cloud with your bare hands. We use tests and benchmarks, like college entrance exams, to get a rough idea. Each year, students cram for these tests, sometimes even scoring a perfect 100%. But does that perfect score m
Notion Launches AI-Enhanced Email Client for Gmail Notion Launches AI-Enhanced Email Client for Gmail Notion Launches Notion Mail: An AI-Powered Email Client for Gmail On Tuesday, Notion unveiled Notion Mail, a new AI-powered email client designed specifically for Gmail users. This innovative tool seamlessly integrates with Notion's broader workflow management platform, enhancing productivity by le
commentaires (35)
0/200
MatthewHill
MatthewHill 18 avril 2025 01:30:04 UTC

Google Cloud's new AI chips and agent ecosystem are a bold move against Microsoft and Amazon! 🤖💪 The 'thinking models' sound cool, but I'm curious to see how they'll actually perform in real-world scenarios. Hope they don't just stay as conference buzzwords! 🚀

GregoryJones
GregoryJones 17 avril 2025 14:12:51 UTC

グーグルクラウドの新しいAIチップとエージェントエコシステム、MicrosoftやAmazonに対抗する大胆な動きだね!🤖💪 「思考モデル」も面白そうだけど、実際のシーンでどれだけ機能するのか気になるな。カンファレンスの話題だけで終わらないことを願ってるよ!🚀

DanielThomas
DanielThomas 18 avril 2025 06:57:23 UTC

구글 클라우드의 새로운 AI 칩과 에이전트 생태계, 마이크로소프트와 아마존에 맞서는 대담한 움직임이야! 🤖💪 '생각 모델'도 재미있어 보이지만, 실제 상황에서 얼마나 기능할지 궁금해. 컨퍼런스 화제로만 끝나지 않길 바래! 🚀

JasonMartin
JasonMartin 17 avril 2025 10:39:27 UTC

Os novos chips de IA e o ecossistema de agentes do Google Cloud são uma jogada ousada contra a Microsoft e a Amazon! 🤖💪 Os 'modelos de pensamento' parecem legais, mas estou curioso para ver como eles vão se sair em cenários reais. Espero que não fiquem só como palavras de ordem em conferências! 🚀

RogerGonzalez
RogerGonzalez 17 avril 2025 06:43:13 UTC

¡Los nuevos chips de IA y el ecosistema de agentes de Google Cloud son un movimiento audaz contra Microsoft y Amazon! 🤖💪 Los 'modelos de pensamiento' suenan geniales, pero tengo curiosidad por ver cómo funcionarán en escenarios del mundo real. ¡Espero que no se queden solo como palabras de moda en conferencias! 🚀

FrankMartínez
FrankMartínez 17 avril 2025 13:24:10 UTC

Google Cloud's new AI chips and agent ecosystem are pretty cool! They're really stepping up their game against Microsoft and Amazon. I'm excited to see how these 'thinking models' will shake things up. The only downside is the learning curve might be steep. Can't wait to dive in and see what I can do with them! 🤓🚀

Retour en haut
OR