Heim
Der Leiter des Bereichs KI bei Google Cloud skizziert die wichtigsten Herausforderungen für die Weiterentwicklung der Modellfähigkeiten

Als Vice President of Product bei Google Cloud liegt Michael Gerstenhabers Hauptaugenmerk auf Vertex, der umfassenden Plattform des Unternehmens für den Einsatz von KI in Unternehmen. Diese Rolle verschafft ihm einen umfassenden Überblick darüber, wie Unternehmen KI-Modelle in der Praxis implementieren und welche wesentlichen Hürden noch bestehen, um das Potenzial der agentischen KI voll auszuschöpfen.
Mein Gespräch mit Michael bot einen besonders originellen Einblick. Er betrachtet die Weiterentwicklung von KI-Modellen als einen gleichzeitigen Vorstoß an drei verschiedenen Fronten: rohe Intelligenz, Reaktionslatenz und ein entscheidender dritter Faktor – Kosteneffizienz. Bei dieser dritten Front geht es weniger um reine Leistungsfähigkeit als vielmehr um Erschwinglichkeit, also darum, ob ein Modell kostengünstig genug bereitgestellt werden kann, um in einem massiven, unvorhersehbaren Maßstab zu funktionieren. Dies ist ein wertvolles Rahmenkonzept für alle, die die Entwicklung modernster Modelle in eine neue Richtung lenken möchten.
Dieses Interview wurde aus Gründen der Übersichtlichkeit gekürzt und überarbeitet.
Könnten Sie zu Beginn Ihren Hintergrund im Bereich KI und Ihre derzeitige Rolle bei Google skizzieren?
Ich arbeite seit etwa zwei Jahren im Bereich KI. Nach anderthalb Jahren bei Anthropic bin ich vor etwa sechs Monaten zu Google gekommen. Ich leite die Vertex-Entwicklerplattform. Unsere Hauptnutzer sind Ingenieure, die maßgeschneiderte Anwendungen entwickeln. Sie suchen Zugang zu agentischen Workflows, einer robusten agentischen Plattform und der Inferenzleistung der weltweit fortschrittlichsten Modelle. Mein Team stellt diese grundlegende Plattform bereit, während die Endnutzeranwendungen von unseren Kunden – Unternehmen wie Shopify und Thomson Reuters – innerhalb ihrer jeweiligen Branchen entwickelt werden.
Was hat Sie zu Ihrem Wechsel zu Google motiviert?
Die einzigartige Position von Google liegt in seiner vertikalen Integration, die von der Benutzeroberfläche bis hinunter zur Infrastrukturebene reicht. Wir entwerfen unsere eigenen Rechenzentren, verwalten die Strombeschaffung, entwickeln maßgeschneiderte Chips (TPUs), trainieren unsere eigenen Grundmodelle und steuern die Inferenz- und agentenbasierten Orchestrierungsebenen. Wir bieten APIs für Funktionen wie Speicher- und Codegenerierung an. Darüber hinaus haben wir eine Agent-Engine für Compliance und Governance sowie Verbraucher- und Unternehmensschnittstellen wie Gemini entwickelt. Diese durchgängige Kontrolle ist eine wesentliche Stärke und ein Hauptgrund, warum ich zu Google gekommen bin.
TechCrunch-VeranstaltungSparen Sie bis zu 300 $ oder 30 % beim TechCrunch Founder Summit
Treffen Sie sich mit über 1.000 Gründern und Investoren auf dem TechCrunch Founder Summit 2026 zu einem ganzen Tag, der ganz im Zeichen von Wachstum, Umsetzung und Skalierung steht. Gewinnen Sie Einblicke von Gründern und Investoren, die die Branche prägen. Knüpfen Sie Kontakte zu Gleichgesinnten, die sich in ähnlichen Wachstumsphasen befinden. Nehmen Sie umsetzbare Strategien mit, die Sie sofort anwenden können.
Das Angebot endet am 13. März.
Sparen Sie bis zu 300 $ oder 30 % beim TechCrunch Founder Summit
Treffen Sie sich mit über 1.000 Gründern und Investoren auf dem TechCrunch Founder Summit 2026 zu einem ganzen Tag, der ganz im Zeichen von Wachstum, Umsetzung und Skalierung steht. Gewinnen Sie Einblicke von Gründern und Investoren, die die Branche prägen. Knüpfen Sie Kontakte zu Kollegen, die sich in ähnlichen Wachstumsphasen befinden. Nehmen Sie umsetzbare Strategien mit, die Sie sofort anwenden können.
Das Angebot endet am 13. März.
Boston, MA | 9. Juni 2026 JETZT ANMELDENEs ist interessant – trotz ihrer Unterschiede scheinen die drei großen KI-Labore in ihren Kernkompetenzen nahezu gleichauf zu sein. Handelt es sich hier um einen reinen Wettlauf um mehr Intelligenz, oder ist die Lage differenzierter?
Ich sehe drei deutliche Leistungsgrenzen. Erstens sind Modelle wie Gemini Pro auf reine Intelligenz optimiert. Aufgaben wie die Generierung komplexer Codes sind ein gutes Beispiel; man möchte die bestmögliche Ausgabequalität, auch wenn es länger dauert, da man diesen Code später warten und bereitstellen muss.
Die zweite Grenze ist die Latenz. In einem Live-Kundensupport-Szenario benötigt eine KI sowohl die Intelligenz, um Richtlinien anzuwenden (z. B. die Bearbeitung einer Rücksendung oder eines Sitzplatz-Upgrades), als auch die Geschwindigkeit, um eine Antwort zu liefern, bevor der Nutzer das Gespräch beendet. Hier benötigen Sie das intelligenteste Modell, das innerhalb eines strengen Zeitbudgets arbeiten kann.
Die dritte Grenze sind die Kosten bei Skalierung. Ein Unternehmen wie Reddit oder Meta, das darauf abzielt, riesige Mengen an Inhalten zu moderieren, sieht sich einer unvorhersehbaren Nachfrage gegenüber. Es kann kein unbegrenztes Unternehmensrisiko eingehen, ohne zu wissen, wie sich die Kosten skalieren. Es benötigt das intelligenteste Modell, das es sich leisten kann und das zudem kosteneffizient genug ist, um eine potenziell unendliche Anzahl von Aufgaben zu bewältigen.
Eine immer wiederkehrende Frage ist, warum agentische KI-Systeme noch keine breitere Verbreitung gefunden haben. Die Modellfähigkeiten und beeindruckenden Demos sind vorhanden, doch der transformative Wandel, den viele vor einem Jahr erwartet haben, hat sich noch nicht vollständig materialisiert. Was sind die Hauptengpässe?
Die zugrunde liegende Technologie ist erst etwa zwei Jahre alt, und es fehlt noch an kritischer Infrastruktur. Uns fehlen etablierte Muster für die Überprüfung von Agentenaktionen oder die Autorisierung des Datenzugriffs für Agenten. Die Implementierung dieser produktionsreifen Muster erfordert erheblichen Aufwand. Die Einführung in der Produktion hinkt immer hinter den technologischen Möglichkeiten hinterher. Zwei Jahre sind einfach nicht genug Zeit, um das gesamte Spektrum der Intelligenz in ausgereiften, eingesetzten Systemen widerzuspiegeln, und genau darin liegt die aktuelle Herausforderung.
In der Softwareentwicklung verlief die Einführung besonders schnell, da sie sich gut in bestehende Entwicklungszyklen integrieren lässt. Ingenieure verfügen über sichere Entwicklungs- und Testumgebungen. Bei Google muss Code von zwei Ingenieuren geprüft und genehmigt werden, bevor er unter dem Namen des Unternehmens an Kunden ausgeliefert wird. Diese Prozesse, bei denen Menschen in den Regelkreis eingebunden sind, machen die Implementierung sehr risikoarm. Wir müssen gleichwertige, sichere Muster für andere Bereiche und Berufe entwickeln.
Verwandter Artikel
Hightouch erreicht mit KI-gestützten Marketing-Tools einen Jahresumsatz von 100 Millionen US-Dollar
Früher waren Marketingfachleute auf Designer und andere Kreativfachleute angewiesen, um Bilder und Videos für personalisierte Online-Werbekampagnen zu erstellen.Ende 2024 führte das sieben Jahre alte
Der Erdgasboom bei Meta könnte das Stromnetz von South Dakota ankurbeln
Rechenzentren sind mittlerweile so riesig geworden, dass ihr Stromverbrauch dem ganzer US-Bundesstaaten entspricht. Man denke nur an das Hyperion-KI-Rechenzentrum von Meta: Nach seiner Fertigstellung
Google führt Gemini in Chrome in Indien ein
Am Mittwoch gab Google bekannt, dass es die Integration von Gemini in Chrome auf neue Regionen ausweitet, darunter Indien, Kanada und Neuseeland. Durch diese Einführung können Desktop-Nutzer über eine
Empfehlungen zu verwandten Spezialthemen
Kommentare (1)
Honestly, I'm a bit skeptical about all these "key frontiers" they keep talking about. Every big tech company has their own list, but real enterprise adoption still stumbles on basic stuff like data quality and cost. Vertex might be Google's shiny platform, but without solving those practical headaches, it's just another expensive toy. 🤷♂️

Als Vice President of Product bei Google Cloud liegt Michael Gerstenhabers Hauptaugenmerk auf Vertex, der umfassenden Plattform des Unternehmens für den Einsatz von KI in Unternehmen. Diese Rolle verschafft ihm einen umfassenden Überblick darüber, wie Unternehmen KI-Modelle in der Praxis implementieren und welche wesentlichen Hürden noch bestehen, um das Potenzial der agentischen KI voll auszuschöpfen.
Mein Gespräch mit Michael bot einen besonders originellen Einblick. Er betrachtet die Weiterentwicklung von KI-Modellen als einen gleichzeitigen Vorstoß an drei verschiedenen Fronten: rohe Intelligenz, Reaktionslatenz und ein entscheidender dritter Faktor – Kosteneffizienz. Bei dieser dritten Front geht es weniger um reine Leistungsfähigkeit als vielmehr um Erschwinglichkeit, also darum, ob ein Modell kostengünstig genug bereitgestellt werden kann, um in einem massiven, unvorhersehbaren Maßstab zu funktionieren. Dies ist ein wertvolles Rahmenkonzept für alle, die die Entwicklung modernster Modelle in eine neue Richtung lenken möchten.
Dieses Interview wurde aus Gründen der Übersichtlichkeit gekürzt und überarbeitet.
Könnten Sie zu Beginn Ihren Hintergrund im Bereich KI und Ihre derzeitige Rolle bei Google skizzieren?
Ich arbeite seit etwa zwei Jahren im Bereich KI. Nach anderthalb Jahren bei Anthropic bin ich vor etwa sechs Monaten zu Google gekommen. Ich leite die Vertex-Entwicklerplattform. Unsere Hauptnutzer sind Ingenieure, die maßgeschneiderte Anwendungen entwickeln. Sie suchen Zugang zu agentischen Workflows, einer robusten agentischen Plattform und der Inferenzleistung der weltweit fortschrittlichsten Modelle. Mein Team stellt diese grundlegende Plattform bereit, während die Endnutzeranwendungen von unseren Kunden – Unternehmen wie Shopify und Thomson Reuters – innerhalb ihrer jeweiligen Branchen entwickelt werden.
Was hat Sie zu Ihrem Wechsel zu Google motiviert?
Die einzigartige Position von Google liegt in seiner vertikalen Integration, die von der Benutzeroberfläche bis hinunter zur Infrastrukturebene reicht. Wir entwerfen unsere eigenen Rechenzentren, verwalten die Strombeschaffung, entwickeln maßgeschneiderte Chips (TPUs), trainieren unsere eigenen Grundmodelle und steuern die Inferenz- und agentenbasierten Orchestrierungsebenen. Wir bieten APIs für Funktionen wie Speicher- und Codegenerierung an. Darüber hinaus haben wir eine Agent-Engine für Compliance und Governance sowie Verbraucher- und Unternehmensschnittstellen wie Gemini entwickelt. Diese durchgängige Kontrolle ist eine wesentliche Stärke und ein Hauptgrund, warum ich zu Google gekommen bin.
TechCrunch-VeranstaltungSparen Sie bis zu 300 $ oder 30 % beim TechCrunch Founder Summit
Treffen Sie sich mit über 1.000 Gründern und Investoren auf dem TechCrunch Founder Summit 2026 zu einem ganzen Tag, der ganz im Zeichen von Wachstum, Umsetzung und Skalierung steht. Gewinnen Sie Einblicke von Gründern und Investoren, die die Branche prägen. Knüpfen Sie Kontakte zu Gleichgesinnten, die sich in ähnlichen Wachstumsphasen befinden. Nehmen Sie umsetzbare Strategien mit, die Sie sofort anwenden können.
Das Angebot endet am 13. März.
Sparen Sie bis zu 300 $ oder 30 % beim TechCrunch Founder Summit
Treffen Sie sich mit über 1.000 Gründern und Investoren auf dem TechCrunch Founder Summit 2026 zu einem ganzen Tag, der ganz im Zeichen von Wachstum, Umsetzung und Skalierung steht. Gewinnen Sie Einblicke von Gründern und Investoren, die die Branche prägen. Knüpfen Sie Kontakte zu Kollegen, die sich in ähnlichen Wachstumsphasen befinden. Nehmen Sie umsetzbare Strategien mit, die Sie sofort anwenden können.
Das Angebot endet am 13. März.
Boston, MA | 9. Juni 2026 JETZT ANMELDENEs ist interessant – trotz ihrer Unterschiede scheinen die drei großen KI-Labore in ihren Kernkompetenzen nahezu gleichauf zu sein. Handelt es sich hier um einen reinen Wettlauf um mehr Intelligenz, oder ist die Lage differenzierter?
Ich sehe drei deutliche Leistungsgrenzen. Erstens sind Modelle wie Gemini Pro auf reine Intelligenz optimiert. Aufgaben wie die Generierung komplexer Codes sind ein gutes Beispiel; man möchte die bestmögliche Ausgabequalität, auch wenn es länger dauert, da man diesen Code später warten und bereitstellen muss.
Die zweite Grenze ist die Latenz. In einem Live-Kundensupport-Szenario benötigt eine KI sowohl die Intelligenz, um Richtlinien anzuwenden (z. B. die Bearbeitung einer Rücksendung oder eines Sitzplatz-Upgrades), als auch die Geschwindigkeit, um eine Antwort zu liefern, bevor der Nutzer das Gespräch beendet. Hier benötigen Sie das intelligenteste Modell, das innerhalb eines strengen Zeitbudgets arbeiten kann.
Die dritte Grenze sind die Kosten bei Skalierung. Ein Unternehmen wie Reddit oder Meta, das darauf abzielt, riesige Mengen an Inhalten zu moderieren, sieht sich einer unvorhersehbaren Nachfrage gegenüber. Es kann kein unbegrenztes Unternehmensrisiko eingehen, ohne zu wissen, wie sich die Kosten skalieren. Es benötigt das intelligenteste Modell, das es sich leisten kann und das zudem kosteneffizient genug ist, um eine potenziell unendliche Anzahl von Aufgaben zu bewältigen.
Eine immer wiederkehrende Frage ist, warum agentische KI-Systeme noch keine breitere Verbreitung gefunden haben. Die Modellfähigkeiten und beeindruckenden Demos sind vorhanden, doch der transformative Wandel, den viele vor einem Jahr erwartet haben, hat sich noch nicht vollständig materialisiert. Was sind die Hauptengpässe?
Die zugrunde liegende Technologie ist erst etwa zwei Jahre alt, und es fehlt noch an kritischer Infrastruktur. Uns fehlen etablierte Muster für die Überprüfung von Agentenaktionen oder die Autorisierung des Datenzugriffs für Agenten. Die Implementierung dieser produktionsreifen Muster erfordert erheblichen Aufwand. Die Einführung in der Produktion hinkt immer hinter den technologischen Möglichkeiten hinterher. Zwei Jahre sind einfach nicht genug Zeit, um das gesamte Spektrum der Intelligenz in ausgereiften, eingesetzten Systemen widerzuspiegeln, und genau darin liegt die aktuelle Herausforderung.
In der Softwareentwicklung verlief die Einführung besonders schnell, da sie sich gut in bestehende Entwicklungszyklen integrieren lässt. Ingenieure verfügen über sichere Entwicklungs- und Testumgebungen. Bei Google muss Code von zwei Ingenieuren geprüft und genehmigt werden, bevor er unter dem Namen des Unternehmens an Kunden ausgeliefert wird. Diese Prozesse, bei denen Menschen in den Regelkreis eingebunden sind, machen die Implementierung sehr risikoarm. Wir müssen gleichwertige, sichere Muster für andere Bereiche und Berufe entwickeln.
Hightouch erreicht mit KI-gestützten Marketing-Tools einen Jahresumsatz von 100 Millionen US-Dollar
Früher waren Marketingfachleute auf Designer und andere Kreativfachleute angewiesen, um Bilder und Videos für personalisierte Online-Werbekampagnen zu erstellen.Ende 2024 führte das sieben Jahre alte
Der Erdgasboom bei Meta könnte das Stromnetz von South Dakota ankurbeln
Rechenzentren sind mittlerweile so riesig geworden, dass ihr Stromverbrauch dem ganzer US-Bundesstaaten entspricht. Man denke nur an das Hyperion-KI-Rechenzentrum von Meta: Nach seiner Fertigstellung
Google führt Gemini in Chrome in Indien ein
Am Mittwoch gab Google bekannt, dass es die Integration von Gemini in Chrome auf neue Regionen ausweitet, darunter Indien, Kanada und Neuseeland. Durch diese Einführung können Desktop-Nutzer über eine
Honestly, I'm a bit skeptical about all these "key frontiers" they keep talking about. Every big tech company has their own list, but real enterprise adoption still stumbles on basic stuff like data quality and cost. Vertex might be Google's shiny platform, but without solving those practical headaches, it's just another expensive toy. 🤷♂️











