option
Maison
Nouvelles
Google dévoile une nouvelle puce pour réduire le coût d'IA caché majeur

Google dévoile une nouvelle puce pour réduire le coût d'IA caché majeur

22 avril 2025
192

Google dévoile une nouvelle puce pour réduire le coût d'IA caché majeur

À l'événement Google Cloud Next 25, Google a dévoilé la dernière version de son unité de traitement tensoriel (TPU), nommée Ironwood. Cette nouvelle puce marque un changement significatif pour Google, mettant l'accent sur l'inférence plutôt que sur l'entraînement. Traditionnellement, les TPU étaient utilisées pour entraîner des réseaux neuronaux, un processus dominé par les spécialistes de l'IA et les data scientists. Cependant, avec Ironwood, Google cible désormais les besoins de prédiction en temps réel de millions, voire de milliards d'utilisateurs.

TPU Ironwood

Le lancement de la TPU Ironwood intervient à un moment crucial dans l'industrie de l'IA, où l'accent passe des projets expérimentaux aux applications pratiques des modèles d'IA par les entreprises. L'émergence de modèles d'IA avancés comme Gemini de Google, qui améliorent les capacités de raisonnement, a accru la demande de puissance de calcul pour l'inférence. Ce changement augmente les coûts, comme Google l'a souligné dans sa description d'Ironwood : « le raisonnement et l'inférence multi-étapes déplacent la demande croissante de calcul — et donc de coût — de l'entraînement vers le temps d'inférence (échelle de test). » Ironwood représente l'engagement de Google à optimiser les performances et l'efficacité, en particulier dans le domaine de plus en plus coûteux de l'inférence.

Une puce d'inférence

Le parcours de Google avec les TPU s'étend sur plus d'une décennie, avec six générations précédant Ironwood. Alors que les puces d'entraînement sont produites en plus faibles volumes, les puces d'inférence s'adressent à un public plus large ayant besoin de prédictions quotidiennes à partir de modèles entraînés, ce qui en fait un marché à fort volume. Auparavant, la TPU de sixième génération de Google, Trillium, était présentée comme capable à la fois d'entraînement et d'inférence. Cependant, l'accent principal d'Ironwood sur l'inférence marque un changement notable par rapport à cette approche à double usage.

Investissement nécessaire

Ce changement de focus pourrait signaler une modification de la dépendance de Google envers des fabricants de puces externes comme Intel, AMD et Nvidia. Historiquement, ces fournisseurs ont dominé les opérations d'informatique en nuage de Google, représentant 99 % des processeurs utilisés, selon KeyBanc Capital Markets. En investissant dans ses propres TPU, Google pourrait chercher à réduire sa dépendance envers ces fournisseurs et potentiellement économiser sur les coûts croissants de l'infrastructure IA. Les analystes boursiers, comme Gil Luria de DA Davidson, ont estimé que si Google vendait des TPU directement aux clients de Nvidia, il aurait pu générer jusqu'à 24 milliards de dollars de revenus l'année dernière.

Ironwood vs Trillium

Google a présenté la supériorité technique d'Ironwood par rapport à Trillium lors de l'événement. Ironwood offre deux fois plus de performance par watt, atteignant 29,3 trillions d'opérations en virgule flottante par seconde. Elle dispose également de 192 Go de mémoire à large bande passante (HBM), six fois plus que Trillium, et d'une bande passante mémoire de 7,2 térabits par seconde, soit 4,5 fois supérieure. Ces améliorations sont conçues pour faciliter un plus grand mouvement de données et réduire la latence sur la puce lors des manipulations de tenseurs, comme Google l'a déclaré : « Ironwood est conçu pour minimiser le mouvement de données et la latence sur la puce tout en effectuant des manipulations massives de tenseurs. »

Expansion de l'infrastructure IA

Les avancées en matière de mémoire et de bande passante sont au cœur de la stratégie de Google pour développer son infrastructure IA. La mise à l'échelle implique l'utilisation efficace de puces groupées pour résoudre des problèmes en parallèle, améliorant les performances et l'utilisation. Cela est crucial pour des raisons économiques, car une utilisation plus élevée signifie moins de gaspillage de ressources coûteuses. Google a précédemment mis en avant la capacité de Trillium à s'étendre à des centaines de milliers de puces, et de manière similaire, ils ont souligné la capacité d'Ironwood à composer « des centaines de milliers de puces Ironwood pour faire progresser rapidement les frontières du calcul GenAI. »

Parallèlement à l'annonce matérielle, Google a également présenté Pathways on Cloud, une solution logicielle qui répartit les tâches de calcul IA sur différentes machines. Auparavant utilisée en interne, ce logiciel est désormais accessible au public, renforçant encore les capacités de l'infrastructure IA de Google.

Article connexe
ElevenLabs annonce que BlackRock, Jamie Foxx et Eva Longoria ont rejoint le cercle de ses investisseurs ElevenLabs annonce que BlackRock, Jamie Foxx et Eva Longoria ont rejoint le cercle de ses investisseurs ElevenLabs, la société spécialisée dans l'IA vocale, a révélé le nom d'investisseurs supplémentaires ayant participé à son tour de table de série D de 500 millions de dollars, initialement annoncé en
Sam Altman, PDG d'OpenAI, fustige Anthropic pour ses stratégies marketing fondées sur la peur Sam Altman, PDG d'OpenAI, fustige Anthropic pour ses stratégies marketing fondées sur la peur Le conflit public qui oppose actuellement les géants de l'IA OpenAI et Anthropic s'est intensifié. Sam Altman, PDG d'OpenAI, a récemment remis en cause le dernier modèle de sécurité de
La start-up de codage Cursor AI prévoit d'embaucher 200 personnes dans la région Asie-Pacifique après avoir reçu un investissement important de la part de SpaceX La start-up de codage Cursor AI prévoit d'embaucher 200 personnes dans la région Asie-Pacifique après avoir reçu un investissement important de la part de SpaceX La start-up spécialisée dans le codage IA Cursor a annoncé une expansion mondiale majeure, prévoyant de recruter 200 collaborateurs dans la région Asie-Pacifique au cours des six prochains mois. Les p
Recommandations de sujets spéciaux liés
Entreprise Le meilleur logiciel d'analyse de contrats basé sur l'IA : identifiez instantanément les failles juridiques et les risques de non-conformité
Le meilleur logiciel d'analyse de contrats basé sur l'IA : identifiez instantanément les failles juridiques et les risques de non-conformité

Découvrez les meilleurs logiciels d'analyse de contrats basés sur l'IA pour 2026 sur XIX.AI. Notre sélection triée sur le volet et très bien notée regroupe des outils performants qui détectent instantanément les failles juridiques et les risques de non-conformité. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Trouvez la solution qui changera la donne pour une analyse de contrats sécurisée et efficace. Découvrez dès maintenant le guide complet.

10 outils
xix.ai
Création d'animations Generateur d'animation AI pour Donghua : Créer des personnages de romans web et des avatars de bandes dessinées
Generateur d'animation AI pour Donghua : Créer des personnages de romans web et des avatars de bandes dessinées

Découvrez les meilleurs générateurs d’animés AI de 2026 pour la création de doublages en chinois. Notre liste, sélectionnée avec soin, propose des outils puissants pour créer des personnages incroyables pour des romans web et des avatars de comics. Comparez les options gratuites et payantes grâce à des tests réels. Trouvez le partenaire créatif idéal et donnez vie à vos histoires dès aujourd’hui sur XIX.AI.

10 outils
xix.ai
Création de bande dessinée Les meilleurs outils d'auto-coloration IA pour les mangas : appliquez des couleurs unies sans aucune erreur de cohérence
Les meilleurs outils d'auto-coloration IA pour les mangas : appliquez des couleurs unies sans aucune erreur de cohérence

Découvrez les meilleurs outils d'auto-coloration IA pour mangas de 2026 sur XIX.AI. Notre sélection regroupe des solutions de premier plan qui changent la donne : elles appliquent des couleurs unies sans aucune erreur de cohérence, ce qui booste votre productivité. Consultez nos comparatifs entre versions gratuites et payantes, nos tests en conditions réelles et nos classements mis à jour chaque semaine pour trouver l'outil qui vous convient le mieux. Profitez dès aujourd'hui de l'avantage de l'IA.

10 outils
xix.ai
en écrivant Les meilleurs créateurs de profils de fiction basés sur l'IA : générer des motivations de personnages cohérentes et des faiblesses fatales
Les meilleurs créateurs de profils de fiction basés sur l'IA : générer des motivations de personnages cohérentes et des faiblesses fatales

Découvrez les meilleurs outils de création de profils de personnages basés sur l'IA de 2026 pour donner de la profondeur à vos personnages. La sélection de XIX.AI regroupe les outils les mieux notés et les plus innovants, capables de générer des motivations cohérentes et des défauts fatals. Comparez les options gratuites et payantes grâce à des tests concrets. Libérez dès maintenant votre potentiel de narration.

10 outils
xix.ai
Entreprise Les meilleurs logiciels d'optimisation des prix basés sur l'IA : suivez vos concurrents et ajustez automatiquement les prix de votre boutique
Les meilleurs logiciels d'optimisation des prix basés sur l'IA : suivez vos concurrents et ajustez automatiquement les prix de votre boutique

Découvrez les meilleurs logiciels d'optimisation des prix basés sur l'IA pour 2026 sur XIX.AI. Notre sélection comprend des outils de premier plan qui changent la donne : ils surveillent vos concurrents et ajustent automatiquement les prix de votre boutique pour maximiser vos bénéfices. Comparez les options gratuites et payantes grâce à des tests concrets. Prenez dès maintenant une longueur d'avance en matière de tarification.

10 outils
xix.ai
code Les meilleurs outils d'analyse de code basés sur l'IA : automatisez la conformité au code propre et refactorisez les fichiers des dépôts hérités
Les meilleurs outils d'analyse de code basés sur l'IA : automatisez la conformité au code propre et refactorisez les fichiers des dépôts hérités

Découvrez les meilleurs outils d'analyse de code par IA de 2026 sur XIX.AI. Notre sélection comprend des outils de premier plan, véritables révolutionnaires, permettant d'automatiser la conformité au code propre et de refactoriser les fichiers de dépôts hérités. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Prenez dès aujourd'hui une longueur d'avance grâce à l'IA.

10 outils
xix.ai
commentaires (18)
0/500
JustinKing
JustinKing 28 août 2025 03:01:29 UTC+02:00

Wow, Google's Ironwood TPU sounds like a game-changer for AI inference! Focusing on efficiency could really shake up the cost dynamics. Curious how this stacks against NVIDIA’s offerings—any bets on who’ll dominate the market? 😎

EllaJohnson
EllaJohnson 15 août 2025 23:00:59 UTC+02:00

Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔

RalphSanchez
RalphSanchez 15 août 2025 01:01:00 UTC+02:00

Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.

GaryGonzalez
GaryGonzalez 24 avril 2025 09:26:40 UTC+02:00

Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞

WalterWalker
WalterWalker 24 avril 2025 06:26:10 UTC+02:00

Googleの新しいTPU、Ironwoodは推論タスクに革命をもたらす!効率化に焦点を当てるのは素晴らしいですね。ただ、古いモデルと互換性がないのがちょっと残念。将来のAI開発に期待しています!🤖

ChristopherAllen
ChristopherAllen 24 avril 2025 03:03:04 UTC+02:00

La nueva TPU de Google, Ironwood, es increíble para tareas de inferencia. ¡Me encanta que se estén enfocando en la eficiencia! Aunque me molesta un poco que no sea compatible con modelos anteriores. ¡Espero ver más avances pronto! 🚀

OR