Option
Heim
Nachricht
Selbstlernende KI-Agenten für ein neues Web-Erlebnis: Ein Leitfaden zur Vorbereitung

Selbstlernende KI-Agenten für ein neues Web-Erlebnis: Ein Leitfaden zur Vorbereitung

19. November 2025
88

Selbstlernende KI-Agenten für ein neues Web-Erlebnis: Ein Leitfaden zur Vorbereitung

In einem neuen Papier schlagen die prominenten KI-Forscher David Silver und Richard Sutton vor, dass die künstliche Intelligenz in eine transformative "Ära der Erfahrung" eintritt. Sie gehen davon aus, dass KI-Systeme zunehmend nicht mehr auf von Menschen bereitgestellte Daten angewiesen sein werden, sondern sich durch direkte Interaktion mit der Welt und Datenerfassung weiterentwickeln.

Obwohl es sich bei dem Papier um ein konzeptionelles und zukunftsorientiertes Werk handelt, sind seine Erkenntnisse von unmittelbarer Bedeutung für Unternehmen, die die Entwicklung und Integration künftiger KI-Agenten und -Systeme planen.

Sowohl Silver als auch Sutton sind angesehene Wissenschaftler, die in der Vergangenheit immer wieder genaue Vorhersagen über die Entwicklung der KI gemacht haben. Ihre Weitsicht zeigt sich in den fortschrittlichsten KI-Systemen von heute. In seinem einflussreichen Aufsatz "The Bitter Lesson" aus dem Jahr 2019 vertrat der Pionier des Reinforcement Learning die Ansicht, dass die bedeutendsten langfristigen Durchbrüche in der KI durchgängig aus der Skalierung der Allzwecksuche und des Lernens mit massiven Berechnungen resultieren und nicht in erster Linie aus der Einbettung komplexen menschlichen Wissens.

David Silver, ein leitender Wissenschaftler bei DeepMind, spielte eine führende Rolle bei der Entwicklung von AlphaGo, AlphaZero und AlphaStar - wichtigen Meilensteinen im Bereich des Deep Reinforcement Learning. Er war auch Mitverfasser eines Papiers aus dem Jahr 2021, in dem er behauptete, dass Verstärkungslernen in Kombination mit einem gut konzipierten Belohnungssignal letztlich zu hochentwickelter KI führen könnte.

Die heutigen hochentwickelten großen Sprachmodelle (LLMs) veranschaulichen diese beiden Konzepte. Die Welle leistungsstarker LLMs seit GPT-3 beruhte weitgehend auf der Skalierung von Rechenleistung und Daten, um immenses Wissen zu absorbieren. Neuere Denkmodelle wie DeepSeek-R1 zeigen außerdem, dass Verstärkungslernen mit einem einfachen Belohnungssignal ausreicht, um komplexe Denkfähigkeiten zu erwerben.

Was ist das Zeitalter der Erfahrung?

Das "Zeitalter der Erfahrung" baut auf Konzepten auf, die Sutton und Silver vertreten haben und die sie nun in den Kontext der jüngsten KI-Fortschritte gestellt haben. Die Autoren stellen fest, dass "das Tempo des Fortschritts, der allein durch überwachtes Lernen aus menschlichen Daten angetrieben wird, sich nachweislich verlangsamt, was die Notwendigkeit eines neuen Ansatzes signalisiert".

Dieser neue Ansatz erfordert eine neue Datenquelle, die auf eine Weise generiert wird, die sich kontinuierlich verbessert, wenn die Fähigkeiten des Agenten zunehmen. "Dies kann dadurch erreicht werden, dass Agenten kontinuierlich aus ihren eigenen Erfahrungen lernen, d. h. aus Daten, die durch die Interaktion des Agenten mit seiner Umgebung entstehen", erklären Sutton und Silver. Sie sind der Meinung, dass "Erfahrung letztendlich das dominierende Medium für Verbesserungen sein wird und den Umfang der menschlichen Daten, die in den heutigen Systemen verwendet werden, in den Schatten stellt".

Nach Ansicht der Autoren werden künftige KI-Systeme "die Grenzen menschlicher KI-Systeme durchbrechen", indem sie nicht nur aus Erfahrungsdaten lernen, sondern auch über vier Schlüsseldimensionen:

  1. Ströme: Anstatt in isolierten Episoden zu agieren, werden KI-Agenten "über einen eigenen Erfahrungsstrom verfügen, der sich wie beim Menschen über einen langen Zeitraum entwickelt". Dies ermöglicht eine langfristige Planung und eine schrittweise Anpassung des Verhaltens. Erste Anzeichen dafür finden sich in KI-Systemen mit umfangreichen Kontextfenstern und Speicherarchitekturen, die durch Benutzerinteraktion kontinuierlich aktualisiert werden.
  2. Handlungen und Beobachtungen: Im Zeitalter der Erfahrung werden Agenten nicht mehr nur Handlungen und Beobachtungen durchführen, die dem Menschen vorbehalten sind, sondern autonom in der realen Welt agieren. Wir sehen dies in agentenbasierten Systemen, die mit Hilfe von Tools wie der Computersteuerung und dem Model Context Protocol (MCP) eine Schnittstelle zu externen Anwendungen und Ressourcen bilden.
  3. Belohnungen: Während derzeitige Reinforcement-Learning-Systeme in hohem Maße von menschlich gestalteten Belohnungsfunktionen abhängen, sollten künftige KI-Agenten ihre eigenen dynamischen Belohnungsfunktionen entwickeln. Diese würden sich im Laufe der Zeit weiterentwickeln und die Präferenzen des Benutzers mit dem realen Feedback aus den Aktionen und Beobachtungen des Agenten abgleichen. Frühe selbstgestaltende Belohnungssysteme wie Nvidias DrEureka geben einen Einblick in diese Zukunft.
  4. Planung und logisches Denken: Derzeitige Denkmodelle sind oft so konzipiert, dass sie das menschliche Denken nachahmen. Die Autoren schlagen vor, dass "es sicherlich effizientere Denkmechanismen gibt, die nicht-menschliche Sprachen verwenden, die zum Beispiel symbolische, verteilte, kontinuierliche oder differenzierbare Berechnungen nutzen". KI-Agenten sollten sich mit der Welt auseinandersetzen und beobachtete Daten nutzen, um ihr Denken zu testen, zu verfeinern und zu aktualisieren, während sie ein internes Weltmodell aufbauen.

Das Konzept der KI-Agenten, die sich durch Verstärkungslernen anpassen, ist nicht neu, aber in der Vergangenheit waren solche Agenten auf eng begrenzte Umgebungen wie Brettspiele beschränkt. Jetzt sind Agenten, die in der Lage sind, sich in komplexen Umgebungen zurechtzufinden - z. B. in der Bedienung von Computern -, in Verbindung mit Fortschritten im Bereich des verstärkenden Lernens in der Lage, diese Beschränkungen zu überwinden und den Übergang in das Zeitalter der Erfahrung zu beschleunigen.

Was bedeutet dies für das Unternehmen?

Eine wichtige Beobachtung in Suttons und Silvers Arbeit für reale Anwendungen lautet: Der Agent kann "menschenfreundliche" Aktionen und Beobachtungen verwenden, wie z. B. Benutzeroberflächen, die die Kommunikation und Zusammenarbeit mit dem Benutzer auf natürliche Weise erleichtern. Der Agent kann auch 'maschinenfreundliche' Aktionen durchführen, die Code ausführen und APIs aufrufen, so dass der Agent im Dienste seiner Ziele autonom handeln kann."

Das Zeitalter der Erfahrung bedeutet, dass Entwickler Anwendungen sowohl für menschliche Benutzer als auch für KI-Agenten entwerfen müssen. Maschinenfreundliche Aktionen erfordern sichere, zugängliche APIs, die direkt oder über Schnittstellen wie MCP verfügbar sind. Dazu gehört auch die Entwicklung von Agenten, die über Protokolle wie Googles Agent2Agent auffindbar sind. Die Entwicklung von APIs und Agentenschnittstellen, die Zugriff auf Aktionen und Beobachtungen gewähren, ermöglicht es den Agenten, aus ihren Interaktionen mit Ihrer Software nach und nach Schlüsse zu ziehen und zu lernen.

Wenn die Vision von Sutton und Silver Wirklichkeit wird, werden schließlich Milliarden von Agenten im Internet - und später auch in der physischen Welt - arbeiten, um Aufgaben zu erfüllen. Ihr Verhalten und ihre Anforderungen werden sich grundlegend von denen menschlicher Benutzer unterscheiden. Die Etablierung agentenfreundlicher Interaktionsmethoden wird entscheidend sein, um künftige KI-Systeme effektiv zu nutzen und potenzielle Risiken zu minimieren.

"Indem wir auf den Grundlagen von RL aufbauen und ihre Kernprinzipien an die Herausforderungen dieser neuen Ära anpassen, können wir das volle Potenzial des autonomen Lernens freisetzen und den Weg zu wahrhaft übermenschlicher Intelligenz ebnen", so Sutton und Silver abschließend.

DeepMind lehnte es ab, weitere Kommentare zu diesem Artikel abzugeben.

Verwandter Artikel
WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr WordPress.com, die beliebte Webhosting- und Publishing-Plattform, setzt nun auf KI-Agenten – ein Schritt, der das Erscheinungsbild des Internets grundlegend verändern könnte. Das Unternehmen gab am Fr
Kakao Mobility stellt einen Fahrplan für autonomes Fahren der Stufe 4 im Bereich der physischen KI vor Kakao Mobility stellt einen Fahrplan für autonomes Fahren der Stufe 4 im Bereich der physischen KI vor Kakao Mobility plant, im Rahmen seiner Strategie für physische KI Technologien für autonomes Fahren der Stufe 4 intern zu entwickeln.Auf der Konferenz „World IT Show 2026“ im COEX in Seoul stellte Ki
Barry Diller: Das Vertrauen in Sam Altman spielt keine Rolle, da die allgemeine künstliche Intelligenz (AGI) immer näher rückt Barry Diller: Das Vertrauen in Sam Altman spielt keine Rolle, da die allgemeine künstliche Intelligenz (AGI) immer näher rückt Barry Diller, der milliardenschwere Medienmogul, hält OpenAI-CEO Sam Altman nicht für unglaubwürdig, obwohl jüngste Berichte das Gegenteil nahelegen. Bei seiner Rede auf der „Future of Everything“-Kon
Empfehlungen zu verwandten Spezialthemen
Geschäft Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren
Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren

Die besten KI-basierten Spesenmanager 2026: Erstklassige Tools zum Scannen von Belegen und zur automatischen Kategorisierung von Unternehmensausgaben. Entdecken Sie leistungsstarke, bahnbrechende Lösungen für müheloses Spesenmanagement, präzise Finanzüberwachung und optimierte Compliance. Unser sorgfältig zusammengestellter, wöchentlich aktualisierter Vergleich zwischen kostenlosen und kostenpflichtigen Optionen hilft Ihnen dabei, die perfekte Lösung zu finden. Nutzen Sie Ihren KI-Vorteil mit den Expertenempfehlungen von XIX.AI.

10 Tools
xix.ai
Geschäft Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren
Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren

Entdecken Sie auf XIX.AI die besten KI-Tools für die Personalbeschaffung des Jahres 2026. Unsere sorgfältig zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Lösungen für die Sichtung von Lebensläufen und die automatisierte Terminplanung für Vorstellungsgespräche. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihren perfekten Assistenten für die Personalbeschaffung und optimieren Sie noch heute Ihren Rekrutierungsprozess!

10 Tools
xix.ai
Produktivität KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern
KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern

Entdecken Sie auf XIX.AI die besten KI-basierten Coaches für persönliches Wohlbefinden und Konzentration des Jahres 2026. Unsere sorgfältig zusammengestellte Rangliste umfasst erstklassige, bahnbrechende Tools zur Bewältigung von Burnout und zur Steigerung der mentalen Energie. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Schlagen Sie noch heute den Weg zu höchster Produktivität und Wohlbefinden ein.

10 Tools
xix.ai
Chatbot Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf
Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf

Entdecken Sie die besten KI-Romantik-Chatbots des Jahres 2026, mit denen Sie echte, langfristige Beziehungen aufbauen können. Unsere sorgfältig zusammengestellte Liste bietet Ihnen überzeugende, konsistente Persönlichkeiten, Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten sowie Tests aus der Praxis. Finden Sie Ihren perfekten Begleiter und legen Sie noch heute bei XIX.AI los.

10 Tools
xix.ai
Bildung und Lernen Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.
Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.

Entdecken Sie die besten AI-Data-Science-Mentoren von 2026, um SQL, Pandas und ML-Arbeitsabläufe zu meistern. Erfahren Sie mehr über unsere hochbewerteten, sorgfältig ausgewählten Angebote bei XIX.AI – für effektive und bahnbrechende Anleitung. Vergleichen Sie kostenlose und bezahlte Optionen mit praktischen Einblicken aus der Praxis. Entfalten Sie Ihr Potenzial in der Data Science noch heute.

10 Tools
xix.ai
Chatbot Die besten KI-Flirt- und Konversationstrainer: Steigere dein soziales Charisma und dein Selbstvertrauen in Echtzeit
Die besten KI-Flirt- und Konversationstrainer: Steigere dein soziales Charisma und dein Selbstvertrauen in Echtzeit

Entdecken Sie auf XIX.AI die besten KI-Flirt- und Konversationstrainer des Jahres 2026. Unsere sorgfältig zusammengestellte, erstklassige Auswahl hilft Ihnen dabei, Ihr soziales Charisma und Ihr Selbstvertrauen in Echtzeit zu stärken. Entdecken Sie unverzichtbare, bahnbrechende Tools mit Vergleichen zwischen kostenlosen und kostenpflichtigen Angeboten sowie wöchentlich aktualisierten Rankings. Schaffen Sie sich noch heute einen sozialen Vorsprung.

10 Tools
xix.ai
Kommentare (0)
0/500
OR