Option
Heim
Nachricht
Google enthüllt einen neuen Chip, um die Major Hidden AI -Kosten zu senken

Google enthüllt einen neuen Chip, um die Major Hidden AI -Kosten zu senken

22. April 2025
192

Google enthüllt einen neuen Chip, um die Major Hidden AI -Kosten zu senken

Beim Google Cloud Next 25 Event hat Google die neueste Version seiner Tensor Processing Unit (TPU) vorgestellt, die den Namen Ironwood trägt. Dieser neue Chip markiert einen bedeutenden Wandel im Fokus von Google und legt den Schwerpunkt auf Inferenz anstelle von Training. Traditionell wurden TPUs für das Training neuronaler Netze verwendet, ein Prozess, der von KI-Spezialisten und Datenwissenschaftlern dominiert wird. Mit Ironwood zielt Google nun auf die Echtzeit-Vorhersagebedürfnisse von Millionen, wenn nicht Milliarden von Nutzern ab.

Ironwood TPU

Die Einführung des Ironwood TPU erfolgt zu einem entscheidenden Zeitpunkt in der KI-Branche, wo der Fokus von experimentellen Projekten hin zu praktischen Anwendungen von KI-Modellen durch Unternehmen wechselt. Das Auftauchen fortschrittlicher KI-Modelle wie Googles Gemini, die die Denkfähigkeiten verbessern, hat die Nachfrage nach Rechenleistung während der Inferenz stark erhöht. Dieser Wandel treibt die Kosten in die Höhe, wie Google in ihrer Beschreibung von Ironwood hervorhob: „Denken und mehrstufige Inferenz verlagern die zusätzliche Nachfrage nach Rechenleistung – und damit die Kosten – vom Training zur Inferenzzeit (Testzeit-Skalierung).“ Ironwood steht für Googles Engagement, Leistung und Effizienz zu optimieren, insbesondere im zunehmend kostspieligen Bereich der Inferenz.

Ein Inferenz-Chip

Googles Reise mit TPUs erstreckt sich über ein Jahrzehnt, mit sechs Generationen vor Ironwood. Während Trainingschips in geringeren Stückzahlen produziert werden, bedienen Inferenzchips ein breiteres Publikum, das tägliche Vorhersagen aus trainierten Modellen benötigt, was es zu einem Markt mit hohem Volumen macht. Zuvor wurde Googles TPU der sechsten Generation, Trillium, als fähig für sowohl Training als auch Inferenz positioniert. Der primäre Fokus von Ironwood auf Inferenz markiert jedoch einen bemerkenswerten Bruch mit diesem dualen Ansatz.

Notwendige Investition

Dieser Wandel im Fokus könnte eine Veränderung in Googles Abhängigkeit von externen Chipherstellern wie Intel, AMD und Nvidia signalisieren. Historisch gesehen haben diese Anbieter Googles Cloud-Computing-Betriebe dominiert und machten laut KeyBanc Capital Markets 99 % der verwendeten Prozessoren aus. Durch Investitionen in eigene TPUs könnte Google darauf abzielen, seine Abhängigkeit von diesen Lieferanten zu reduzieren und potenziell die steigenden Kosten der KI-Infrastruktur zu senken. Aktienanalysten wie Gil Luria von DA Davidson haben geschätzt, dass Google, wenn es TPUs direkt an Nvidias Kunden verkauft hätte, im letzten Jahr bis zu 24 Milliarden Dollar Umsatz hätte erzielen können.

Ironwood vs. Trillium

Google präsentierte auf der Veranstaltung die technische Überlegenheit von Ironwood gegenüber Trillium. Ironwood bietet die doppelte Leistung pro Watt und erreicht 29,3 Billionen Gleitkommaoperationen pro Sekunde. Es verfügt außerdem über 192 GB Hochgeschwindigkeitsspeicher (HBM), das Sechsfache von Trillium, und eine Speicherbandbreite von 7,2 Terabit pro Sekunde, was 4,5-mal höher ist. Diese Verbesserungen sind darauf ausgelegt, eine größere Datenbewegung zu erleichtern und die Latenz auf dem Chip während Tensor-Manipulationen zu reduzieren, wie Google erklärte: „Ironwood ist darauf ausgelegt, die Datenbewegung und Latenz auf dem Chip zu minimieren, während massive Tensor-Manipulationen durchgeführt werden.“

Skalierung der KI-Infrastruktur

Die Fortschritte in Speicher und Bandbreite sind zentral für Googles Strategie zur Skalierung seiner KI-Infrastruktur. Skalierung bedeutet, gruppierte Chips effizient zu nutzen, um Probleme parallel zu lösen, was die Leistung und Auslastung verbessert. Dies ist aus wirtschaftlichen Gründen entscheidend, da eine höhere Auslastung weniger Verschwendung kostspieliger Ressourcen bedeutet. Google hat zuvor die Fähigkeit von Trillium hervorgehoben, auf Hunderttausende von Chips zu skalieren, und ähnlich betonten sie die Fähigkeit von Ironwood, „Hunderttausende von Ironwood-Chips zusammenzustellen, um die Grenzen der GenAI-Berechnung schnell voranzutreiben.“

Neben der Hardware-Ankündigung stellte Google auch Pathways on Cloud vor, eine Softwarelösung, die KI-Rechenaufgaben auf verschiedene Maschinen verteilt. Diese Software, die zuvor intern genutzt wurde, ist nun auch der Öffentlichkeit zugänglich und verbessert die Fähigkeiten von Googles KI-Infrastruktur weiter.

Verwandter Artikel
Britische Ministerien streiten über den Energiebedarf von KI-Rechenzentren Britische Ministerien streiten über den Energiebedarf von KI-Rechenzentren Die britische Regierung steht vor einer großen Herausforderung: Sie will die Nutzung sauberer Energien vorantreiben und gleichzeitig eine weltweit führende Rolle im Bereich der künstlichen Intelligenz
Die chinesische Cyberspace-Behörde schreibt die Kennzeichnung von KI-generierten und fiktionalen Kurzvideos vor Die chinesische Cyberspace-Behörde schreibt die Kennzeichnung von KI-generierten und fiktionalen Kurzvideos vor Die chinesische Cyberspace-Behörde hat einen umfassenden Plan zur Vereinheitlichung der Kennzeichnung von Kurzvideoinhalten vorgestellt, der Plattformen zur Verwendung von sechs vorgeschriebenen Kennz
DeepL, bekannt für seine Textübersetzungen, widmet sich nun der Sprachübersetzung DeepL, bekannt für seine Textübersetzungen, widmet sich nun der Sprachübersetzung DeepL, ein Übersetzungsunternehmen, das vor allem für seine textbasierten Tools bekannt ist, hat heute eine Suite für Sprach-zu-Sprach-Übersetzungen auf den Markt gebracht, die über maßgeschneiderte A
Empfehlungen zu verwandten Spezialthemen
Comic-Erstellung Die besten KI-Tools zur automatischen Kolorierung von Manga: Flache Farben ohne Konsistenzfehler anwenden
Die besten KI-Tools zur automatischen Kolorierung von Manga: Flache Farben ohne Konsistenzfehler anwenden

Entdecken Sie bei XIX.AI die besten KI-Tools zur automatischen Kolorierung von Manga für das Jahr 2026. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Lösungen, die flächige Farben ohne Konsistenzfehler auftragen und so Ihre Produktivität steigern. Entdecken Sie Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten, Praxistests und wöchentlich aktualisierte Rankings, um das für Sie perfekte Tool zu finden. Nutzen Sie noch heute Ihren KI-Vorteil.

10 Tools
xix.ai
Schreiben Die besten KI-Profilersteller: Erstellen Sie konsistente Charaktermotivationen und fatale Schwächen
Die besten KI-Profilersteller: Erstellen Sie konsistente Charaktermotivationen und fatale Schwächen

Entdecken Sie die besten KI-Tools zur Charakterentwicklung für 2026, mit denen Sie facettenreiche Figuren erschaffen können. Die von XIX.AI zusammengestellte Liste enthält erstklassige, bahnbrechende Tools, die konsistente Motivationen und fatale Schwächen generieren. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie jetzt Ihr Potenzial als Geschichtenerzähler.

10 Tools
xix.ai
Geschäft Die beste Software zur Preisoptimierung mittels KI: Beobachten Sie die Konkurrenz und passen Sie Ihre Shop-Preise automatisch an
Die beste Software zur Preisoptimierung mittels KI: Beobachten Sie die Konkurrenz und passen Sie Ihre Shop-Preise automatisch an

Entdecken Sie auf XIX.AI die beste Software zur Preisoptimierung mittels KI für 2026. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Tools, die Ihre Mitbewerber beobachten und Ihre Shop-Preise automatisch anpassen, um den maximalen Gewinn zu erzielen. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Sichern Sie sich jetzt Ihren Preisvorteil.

10 Tools
xix.ai
Code Die besten KI-Code-Prüfer: Automatisierung der Einhaltung von Clean-Code-Standards und Refactoring von Dateien in älteren Repositorys
Die besten KI-Code-Prüfer: Automatisierung der Einhaltung von Clean-Code-Standards und Refactoring von Dateien in älteren Repositorys

Entdecken Sie die besten KI-Code-Reviewer des Jahres 2026 auf XIX.AI. Unsere sorgfältig zusammengestellte Liste enthält erstklassige, bahnbrechende Tools zur Automatisierung der Einhaltung von Clean-Code-Standards und zur Refaktorisierung von Dateien in älteren Repositorys. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Sichern Sie sich noch heute Ihren KI-Vorsprung.

10 Tools
xix.ai
Text-zu-Sprache Die besten KI-Sprachausgabe-Apps für Legasthenie: Unterstützung für das Lernen und effizienteres Lesen bei Schülern
Die besten KI-Sprachausgabe-Apps für Legasthenie: Unterstützung für das Lernen und effizienteres Lesen bei Schülern

Entdecken Sie die besten KI-TTS-Apps des Jahres 2026, die speziell zur Unterstützung bei Legasthenie ausgewählt wurden. In unseren Experten-Rankings vergleichen wir kostenlose und kostenpflichtige Tools und stellen leistungsstarke Funktionen für mehr Leseeffizienz und besseren Lernerfolg vor. Entdecken Sie bahnbrechende Lösungen, die Sie unbedingt ausprobieren sollten, um das Potenzial Ihrer Schüler voll auszuschöpfen. Beginnen Sie Ihre Reise bei XIX.AI.

10 Tools
xix.ai
Comic-Erstellung Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte
Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte

Entdecken Sie bei XIX.AI die besten KI-Generatoren für Shonen-Manga des Jahres 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools zur Erstellung actiongeladener Sequenzen und dynamischer Energieeffekte. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie Ihr kreatives Potenzial und beginnen Sie noch heute mit der Gestaltung epischer Manga!

15 Tools
xix.ai
Kommentare (18)
0/500
JustinKing
JustinKing 28. August 2025 03:01:29 MESZ

Wow, Google's Ironwood TPU sounds like a game-changer for AI inference! Focusing on efficiency could really shake up the cost dynamics. Curious how this stacks against NVIDIA’s offerings—any bets on who’ll dominate the market? 😎

EllaJohnson
EllaJohnson 15. August 2025 23:00:59 MESZ

Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔

RalphSanchez
RalphSanchez 15. August 2025 01:01:00 MESZ

Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.

GaryGonzalez
GaryGonzalez 24. April 2025 09:26:40 MESZ

Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞

WalterWalker
WalterWalker 24. April 2025 06:26:10 MESZ

Googleの新しいTPU、Ironwoodは推論タスクに革命をもたらす!効率化に焦点を当てるのは素晴らしいですね。ただ、古いモデルと互換性がないのがちょっと残念。将来のAI開発に期待しています!🤖

ChristopherAllen
ChristopherAllen 24. April 2025 03:03:04 MESZ

La nueva TPU de Google, Ironwood, es increíble para tareas de inferencia. ¡Me encanta que se estén enfocando en la eficiencia! Aunque me molesta un poco que no sea compatible con modelos anteriores. ¡Espero ver más avances pronto! 🚀

OR