Heim
Chrome führt die Prompt-API ein und läutet mit Gemini Nano das Zeitalter der nativen Browser-KI ein
Der Google Chrome-Browser hat offiziell die Prompt-API eingeführt, die es Entwicklern ermöglicht, das integrierte Gemini-Nano-Modell mit einfachem JavaScript-Code direkt auf Webseiten aufzurufen und so KI-Funktionen direkt auf die Client-Seite zu bringen. Diese Ankündigung hat auf Hacker News eine lebhafte Diskussion ausgelöst und findet rasch breite Beachtung, da sie als wichtiger Schritt zur Demokratisierung der KI im Browser angesehen wird.

Was ist die Prompt-API?
Die Prompt-API ist eine Komponente des in Chrome integrierten KI-Frameworks. Sie ermöglicht es Webanwendungen, Anweisungen in natürlicher Sprache an das direkt im Browser eingebettete, schlanke Sprachmodell Gemini Nano zu senden. Gemini Nano ist ein kompaktes Modell von Google, das für die Nutzung auf dem Endgerät optimiert ist und lokal auf dem Rechner des Nutzers läuft, ohne dass Cloud-Server erforderlich sind.
Dies stellt eine grundlegende Abkehr von traditionellen Methoden der KI-Integration dar. Bisher mussten Entwickler auf externe APIs wie OpenAI oder Claude zurückgreifen und sich dabei mit Herausforderungen wie Cross-Origin-Beschränkungen, API-Schlüsselverwaltung, Kosten und Datenschutz auseinandersetzen. Nun lassen sich ähnliche Funktionen mit nur wenigen Zeilen Code realisieren:
const session = await ai.languageModel.create();
Das Modell läuft im Browser über Technologien wie WebAssembly oder WebGPU. Alle Daten verbleiben auf dem Gerät des Nutzers, was den Datenschutz erheblich verbessert und Offline-Anwendungsfälle ermöglicht.
Kernvorteile: Datenschutz, Sicherheit und Benutzerfreundlichkeit
Lokale Ausführung mit Datenschutz an erster Stelle: Das Gemini-Nano-Modell wird automatisch basierend auf dem Gerät des Nutzers heruntergeladen (mit einer Größe von mehreren Gigabyte). Die gesamte Inferenz erfolgt lokal, was bedeutet, dass Nutzereingaben niemals in die Cloud gesendet werden. Dies geht direkt auf weit verbreitete Bedenken von Unternehmen und Privatpersonen hinsichtlich Datenlecks bei cloudbasierter KI ein.
Geringere Entwicklungshürden: Es ist nicht notwendig, Serverkosten einzuplanen, API-Schlüssel zu verwalten oder Netzwerkverzögerungen zu berücksichtigen. KI-Fähigkeiten werden zu einer nativen Browserfunktion, ähnlich der grundlegenden Rolle von JavaScript. Entwickler können Funktionen wie Textübersetzung, Zusammenfassung, Umschreiben von Inhalten und semantische Suche schnell implementieren und damit den Weg für komplexere lokale KI-Anwendungen ebnen.
Breites Anwendungspotenzial: Diese Funktion kann überall genutzt werden, von Browser-Erweiterungen bis hin zu Standard-Webseiten. Erste Innovationen zeichnen sich bereits ab, wie beispielsweise die Zusammenfassung von Inhalten in Echtzeit, Offline-Chatbots und clientseitige semantische Filterung.
Aktueller Status und Einschränkungen
Derzeit befindet sich die Prompt-API in einer experimentellen Phase bzw. einer frühen Verfügbarkeitsphase. Der Zugriff erfolgt in erster Linie durch Aktivieren experimenteller Flags (über chrome://flags) in Chrome Canary, dem Dev-Kanal oder bestimmten Versionen wie Chrome 137+. Die Fähigkeiten des Modells sind im Vergleich zu cloudbasierten großen Sprachmodellen eingeschränkter, und es ist eine ausreichende Geräteleistung (einschließlich Arbeitsspeicher und GPU-Beschleunigung) erforderlich. Google hat einen Origin Trial gestartet, der es Entwicklern ermöglicht, das Modell in Produktionsumgebungen zu testen und Feedback zu geben.
In der offiziellen Chrome-Dokumentation wird darauf hingewiesen, dass der Browser Modell-Downloads automatisch abwickelt, wobei es bei der ersten Nutzung zu einer kurzen Wartezeit kommen kann. Es wird erwartet, dass diese Funktion schrittweise auf stabile Kanäle ausgeweitet und in Zukunft möglicherweise auf weitere Plattformen ausgeweitet wird.
Auswirkungen auf die Branche: KI als grundlegende Browserfunktion
Branchenbeobachter sehen die Prompt-API als Wendepunkt für browserbasierte KI. Da KI zu einer Standard-Webfunktion wie JavaScript wird, wird eine neue Welle von Innovationen bei Webanwendungen erwartet. Microsoft Edge untersucht ähnliche Schnittstellen und beschleunigt damit den branchenweiten Wandel hin zu „On-Device-KI“.
Diese Entwicklung senkt nicht nur die Hürden für den Einsatz von KI, sondern fördert auch die Schaffung datenschutzbewusster, offline-freundlicher Web-Erlebnisse. Zukünftige Browser könnten weitere KI-Grundfunktionen integrieren und so intelligente Features sowohl für Endnutzer als auch für Entwickler zugänglich machen.
AIbase-Kommentar: Der Schritt von Chrome beschleunigt die Verlagerung der KI von der Cloud zum Edge. Auch wenn die aktuellen Funktionen begrenzt sind, ist die symbolische Bedeutung erheblich – Browser entwickeln sich von reinen Darstellungswerkzeugen zu intelligenten Plattformen. Entwickler sollten den Fortschritt genau beobachten und frühzeitig Tests durchführen, um Chancen in der nächsten Generation von Web-KI-Anwendungen zu nutzen.
Link: https://developer.chrome.com/docs/ai/prompt-api
Verwandter Artikel
Die chinesische Cyberspace-Behörde schreibt die Kennzeichnung von KI-generierten und fiktionalen Kurzvideos vor
Die chinesische Cyberspace-Behörde hat einen umfassenden Plan zur Vereinheitlichung der Kennzeichnung von Kurzvideoinhalten vorgestellt, der Plattformen zur Verwendung von sechs vorgeschriebenen Kennz
DeepL, bekannt für seine Textübersetzungen, widmet sich nun der Sprachübersetzung
DeepL, ein Übersetzungsunternehmen, das vor allem für seine textbasierten Tools bekannt ist, hat heute eine Suite für Sprach-zu-Sprach-Übersetzungen auf den Markt gebracht, die über maßgeschneiderte A
Talats KI-Besprechungsnotizen werden auf Ihrem Gerät gespeichert, nicht in der Cloud
Granola, die KI-gestützte Notiz-App mit einem Unternehmenswert von 250 Millionen Dollar, hat bei Tech-Gründern und Risikokapitalgebern an Beliebtheit gewonnen. Ein Entwickler sieht jedoch Bedarf an ei
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Der Google Chrome-Browser hat offiziell die Prompt-API eingeführt, die es Entwicklern ermöglicht, das integrierte Gemini-Nano-Modell mit einfachem JavaScript-Code direkt auf Webseiten aufzurufen und so KI-Funktionen direkt auf die Client-Seite zu bringen. Diese Ankündigung hat auf Hacker News eine lebhafte Diskussion ausgelöst und findet rasch breite Beachtung, da sie als wichtiger Schritt zur Demokratisierung der KI im Browser angesehen wird.

Was ist die Prompt-API?
Die Prompt-API ist eine Komponente des in Chrome integrierten KI-Frameworks. Sie ermöglicht es Webanwendungen, Anweisungen in natürlicher Sprache an das direkt im Browser eingebettete, schlanke Sprachmodell Gemini Nano zu senden. Gemini Nano ist ein kompaktes Modell von Google, das für die Nutzung auf dem Endgerät optimiert ist und lokal auf dem Rechner des Nutzers läuft, ohne dass Cloud-Server erforderlich sind.
Dies stellt eine grundlegende Abkehr von traditionellen Methoden der KI-Integration dar. Bisher mussten Entwickler auf externe APIs wie OpenAI oder Claude zurückgreifen und sich dabei mit Herausforderungen wie Cross-Origin-Beschränkungen, API-Schlüsselverwaltung, Kosten und Datenschutz auseinandersetzen. Nun lassen sich ähnliche Funktionen mit nur wenigen Zeilen Code realisieren:
const session = await ai.languageModel.create();
Das Modell läuft im Browser über Technologien wie WebAssembly oder WebGPU. Alle Daten verbleiben auf dem Gerät des Nutzers, was den Datenschutz erheblich verbessert und Offline-Anwendungsfälle ermöglicht.
Kernvorteile: Datenschutz, Sicherheit und Benutzerfreundlichkeit
Lokale Ausführung mit Datenschutz an erster Stelle: Das Gemini-Nano-Modell wird automatisch basierend auf dem Gerät des Nutzers heruntergeladen (mit einer Größe von mehreren Gigabyte). Die gesamte Inferenz erfolgt lokal, was bedeutet, dass Nutzereingaben niemals in die Cloud gesendet werden. Dies geht direkt auf weit verbreitete Bedenken von Unternehmen und Privatpersonen hinsichtlich Datenlecks bei cloudbasierter KI ein.
Geringere Entwicklungshürden: Es ist nicht notwendig, Serverkosten einzuplanen, API-Schlüssel zu verwalten oder Netzwerkverzögerungen zu berücksichtigen. KI-Fähigkeiten werden zu einer nativen Browserfunktion, ähnlich der grundlegenden Rolle von JavaScript. Entwickler können Funktionen wie Textübersetzung, Zusammenfassung, Umschreiben von Inhalten und semantische Suche schnell implementieren und damit den Weg für komplexere lokale KI-Anwendungen ebnen.
Breites Anwendungspotenzial: Diese Funktion kann überall genutzt werden, von Browser-Erweiterungen bis hin zu Standard-Webseiten. Erste Innovationen zeichnen sich bereits ab, wie beispielsweise die Zusammenfassung von Inhalten in Echtzeit, Offline-Chatbots und clientseitige semantische Filterung.
Aktueller Status und Einschränkungen
Derzeit befindet sich die Prompt-API in einer experimentellen Phase bzw. einer frühen Verfügbarkeitsphase. Der Zugriff erfolgt in erster Linie durch Aktivieren experimenteller Flags (über chrome://flags) in Chrome Canary, dem Dev-Kanal oder bestimmten Versionen wie Chrome 137+. Die Fähigkeiten des Modells sind im Vergleich zu cloudbasierten großen Sprachmodellen eingeschränkter, und es ist eine ausreichende Geräteleistung (einschließlich Arbeitsspeicher und GPU-Beschleunigung) erforderlich. Google hat einen Origin Trial gestartet, der es Entwicklern ermöglicht, das Modell in Produktionsumgebungen zu testen und Feedback zu geben.
In der offiziellen Chrome-Dokumentation wird darauf hingewiesen, dass der Browser Modell-Downloads automatisch abwickelt, wobei es bei der ersten Nutzung zu einer kurzen Wartezeit kommen kann. Es wird erwartet, dass diese Funktion schrittweise auf stabile Kanäle ausgeweitet und in Zukunft möglicherweise auf weitere Plattformen ausgeweitet wird.
Auswirkungen auf die Branche: KI als grundlegende Browserfunktion
Branchenbeobachter sehen die Prompt-API als Wendepunkt für browserbasierte KI. Da KI zu einer Standard-Webfunktion wie JavaScript wird, wird eine neue Welle von Innovationen bei Webanwendungen erwartet. Microsoft Edge untersucht ähnliche Schnittstellen und beschleunigt damit den branchenweiten Wandel hin zu „On-Device-KI“.
Diese Entwicklung senkt nicht nur die Hürden für den Einsatz von KI, sondern fördert auch die Schaffung datenschutzbewusster, offline-freundlicher Web-Erlebnisse. Zukünftige Browser könnten weitere KI-Grundfunktionen integrieren und so intelligente Features sowohl für Endnutzer als auch für Entwickler zugänglich machen.
AIbase-Kommentar: Der Schritt von Chrome beschleunigt die Verlagerung der KI von der Cloud zum Edge. Auch wenn die aktuellen Funktionen begrenzt sind, ist die symbolische Bedeutung erheblich – Browser entwickeln sich von reinen Darstellungswerkzeugen zu intelligenten Plattformen. Entwickler sollten den Fortschritt genau beobachten und frühzeitig Tests durchführen, um Chancen in der nächsten Generation von Web-KI-Anwendungen zu nutzen.
Link: https://developer.chrome.com/docs/ai/prompt-api
Die chinesische Cyberspace-Behörde schreibt die Kennzeichnung von KI-generierten und fiktionalen Kurzvideos vor
Die chinesische Cyberspace-Behörde hat einen umfassenden Plan zur Vereinheitlichung der Kennzeichnung von Kurzvideoinhalten vorgestellt, der Plattformen zur Verwendung von sechs vorgeschriebenen Kennz
DeepL, bekannt für seine Textübersetzungen, widmet sich nun der Sprachübersetzung
DeepL, ein Übersetzungsunternehmen, das vor allem für seine textbasierten Tools bekannt ist, hat heute eine Suite für Sprach-zu-Sprach-Übersetzungen auf den Markt gebracht, die über maßgeschneiderte A
Talats KI-Besprechungsnotizen werden auf Ihrem Gerät gespeichert, nicht in der Cloud
Granola, die KI-gestützte Notiz-App mit einem Unternehmenswert von 250 Millionen Dollar, hat bei Tech-Gründern und Risikokapitalgebern an Beliebtheit gewonnen. Ein Entwickler sieht jedoch Bedarf an ei











