KI ist jenseits des menschlichen Wissens gewachsen, sagt die Deepmind -Einheit von Google
Fortschritte in der KI über traditionelle Tests hinaus: Der Aufstieg des erfahrungsbasierten Lernens
Das Feld der künstlichen Intelligenz (KI) ist voller Bestrebungen, generative KI über die Grenzen traditioneller Benchmarks wie den Turing-Test hinaus zu entwickeln, den viele Modelle bereits übertroffen haben. Der Fokus liegt nun darauf, KI zu entwickeln, die nicht nur darauf ausgelegt ist, diese Tests zu bestehen, sondern sich durch einen dynamischeren Prozess weiterentwickelt.
Forscher bei Googles DeepMind, darunter Legenden wie David Silver und Richard Sutton, argumentieren in ihrem Paper Willkommen im Zeitalter der Erfahrung, dass der Schlüssel zur Erschließung neuer KI-Fähigkeiten nicht in den Tests liegt, sondern in der Art und Weise, wie KI trainiert wird. Sie schlagen vor, dass die derzeit verwendeten statischen Datensätze zu begrenzt sind, um bedeutende Fortschritte zu fördern.
Ihre Lösung? KI muss auf eine erfahrungsbasiertere Weise mit der Welt interagieren, aus Interaktionen lernen und Ziele basierend auf Umweltfeedback setzen. „Unglaubliche neue Fähigkeiten werden entstehen, sobald das volle Potenzial des erfahrungsbasierten Lernens ausgeschöpft ist“, behaupten sie. Silver, bekannt für seine Arbeit an AlphaZero, das Menschen im Schach und Go besiegt hat, und Sutton, ein Pionier des bestärkenden Lernens, schlagen einen neuen Ansatz namens „Streams“ vor, um die Grenzen aktueller großer Sprachmodelle (LLMs) zu überwinden.

Google DeepMind Vom bestärkenden Lernen zur generativen KI: Ein Wandel und seine Folgen
Nach den Erfolgen von AlphaZero und AlphaGo sah die KI-Gemeinschaft einen Wandel hin zu generativen KI-Modellen wie ChatGPT, die weitgehend vom bestärkenden Lernen weggegangen sind. Während dies der KI ermöglichte, ein breiteres Spektrum spontaner menschlicher Eingaben zu verarbeiten, bedeutete es auch den Verlust des Aspekts der Selbstentdeckung, den das bestärkende Lernen ermöglichte.
Laut Silver und Sutton stützen sich aktuelle LLMs stark auf menschliches Urteilsvermögen in der Prompt-Phase, was ihr Potenzial einschränkt. „Der Agent kann keine besseren Strategien entdecken, die vom menschlichen Bewerter unterschätzt werden“, erklären sie. Darüber hinaus erlaubt die kurze, abgehackte Natur von Prompt-Interaktionen der KI nicht, über einfache Frage-und-Antwort-Austausche hinauszugehen.
Einführung von Streams: Ein neues Paradigma für das KI-Lernen
Das vorgeschlagene „Zeitalter der Erfahrung“ beinhaltet KI-Agenten, die innerhalb von „Streams“ kontinuierlicher Interaktion operieren, ähnlich wie Menschen über ein Leben lang lernen. Silver und Sutton stellen sich KI-Agenten mit ihren eigenen langfristigen Erfahrungsströmen vor, die es ihnen ermöglichen, Ziele über unmittelbare Aufgaben hinaus zu verfolgen.
Dieser Ansatz baut auf bestärkendem Lernen auf, bei dem KI-Agenten mit einem Weltmodell interagieren und Rückmeldungen in Form von Belohnungen erhalten. Diese Belohnungen helfen der KI zu lernen, welche Aktionen in verschiedenen Kontexten wertvoll sind. Die Forscher weisen darauf hin, dass die Welt reich an Signalen ist, die als Belohnungen dienen können, von wirtschaftlichen Indikatoren bis hin zu Gesundheitsmetriken.
Aufbau von KI-Agenten mit langfristigen Zielen
Um diesen Prozess zu starten, könnten KI-Entwickler eine „Weltmodell“-Simulation verwenden, die es der KI ermöglicht, Vorhersagen zu treffen, diese in der Realität zu testen und ihr Modell basierend auf den Ergebnissen zu verfeinern. Während die KI weiterhin mit der Welt interagiert, entwickelt sich ihr Verständnis weiter, passt sich neuen Daten an und korrigiert Fehler.
Menschen würden weiterhin eine Rolle dabei spielen, breite Ziele festzulegen, wie etwa die Verbesserung der Fitness oder das Erlernen einer neuen Sprache, wobei die Belohnungsfunktion der KI auf diese Ziele ausgerichtet ist. Dieses Setup könnte zu KI-Assistenten führen, die über längere Zeiträume hinweg Gesundheit oder Bildung verfolgen und beraten oder sogar ehrgeizige wissenschaftliche Ziele wie die Entdeckung neuer Materialien oder die Reduzierung von Kohlenstoffemissionen verfolgen.
Die Zukunft der KI: Über das Denken hinaus zum erfahrungsbasierten Lernen
Die Forscher glauben, dass KI-Agenten, die zu langfristigem erfahrungsbasiertem Lernen fähig sind, aktuelle „denkende“ KI-Modelle wie Gemini und DeepSeeks R1 übertreffen könnten. Sie argumentieren, dass denkende Modelle oft menschliches Denken nachahmen, was durch veraltete Annahmen eingeschränkt sein kann. Im Gegensatz dazu könnten erfahrungsbasierte Agenten beispiellose Fähigkeiten freisetzen, die zu einer Zukunft führen, die sich stark von dem unterscheidet, was wir bisher gesehen haben.
Dieser Wandel bringt jedoch auch Risiken mit sich, wie etwa Arbeitsplatzverluste und die Herausforderung, KI-Agenten zu kontrollieren, die über lange Zeiträume autonom operieren können. Auf der anderen Seite könnte anpassungsfähige KI lernen, negative Auswirkungen auf Menschen zu mildern, indem sie ihr Verhalten basierend auf Feedback anpasst.
Silver und Sutton sind überzeugt, dass erfahrungsbasierte Daten die Skala und Qualität menschlich generierter Daten bei weitem übertreffen werden, was potenziell zu künstlicher allgemeiner Intelligenz oder Superintelligenz führen könnte. Dieser Paradigmenwechsel, gekoppelt mit Fortschritten im bestärkenden Lernen, könnte neue Fähigkeiten freisetzen, die in vielen Bereichen jenseits menschlicher Reichweite liegen.
Silver diskutierte diese Ideen kürzlich in einem DeepMind-Podcast und beleuchtete das Potenzial und die Herausforderungen, KI in das Zeitalter der Erfahrung zu führen.
Verwandter Artikel
KI-gestützte Musikerstellung: Songs und Videos mühelos erstellen
Musikerstellung kann komplex sein und erfordert Zeit, Ressourcen und Fachwissen. Künstliche Intelligenz hat diesen Prozess revolutioniert und ihn einfach und zugänglich gemacht. Dieser Leitfaden zeigt
Erstellung KI-gestützter Malbücher: Ein umfassender Leitfaden
Das Gestalten von Malbüchern ist ein lohnendes Unterfangen, das künstlerischen Ausdruck mit beruhigenden Erlebnissen für Nutzer verbindet. Der Prozess kann jedoch arbeitsintensiv sein. Glücklicherweis
Qodo Partnerschaft mit Google Cloud zur Bereitstellung kostenloser KI-Code-Review-Tools für Entwickler
Qodo, ein in Israel ansässiges KI-Startup für Codierung, das sich auf Codequalität konzentriert, hat eine Partnerschaft mit Google Cloud gestartet, um die Integrität von KI-generiertem Softwarecode zu
Kommentare (9)
0/200
WalterNelson
19. August 2025 08:26:53 MESZ
AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀
0
ScottWalker
15. August 2025 17:00:59 MESZ
AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀
0
AlbertGarcía
8. August 2025 04:00:59 MESZ
Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?
0
FrankSanchez
28. Juli 2025 03:20:02 MESZ
This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!
0
CarlGarcia
27. April 2025 20:31:27 MESZ
AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!
0
PaulTaylor
27. April 2025 17:12:58 MESZ
¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!
0
Fortschritte in der KI über traditionelle Tests hinaus: Der Aufstieg des erfahrungsbasierten Lernens
Das Feld der künstlichen Intelligenz (KI) ist voller Bestrebungen, generative KI über die Grenzen traditioneller Benchmarks wie den Turing-Test hinaus zu entwickeln, den viele Modelle bereits übertroffen haben. Der Fokus liegt nun darauf, KI zu entwickeln, die nicht nur darauf ausgelegt ist, diese Tests zu bestehen, sondern sich durch einen dynamischeren Prozess weiterentwickelt.
Forscher bei Googles DeepMind, darunter Legenden wie David Silver und Richard Sutton, argumentieren in ihrem Paper Willkommen im Zeitalter der Erfahrung, dass der Schlüssel zur Erschließung neuer KI-Fähigkeiten nicht in den Tests liegt, sondern in der Art und Weise, wie KI trainiert wird. Sie schlagen vor, dass die derzeit verwendeten statischen Datensätze zu begrenzt sind, um bedeutende Fortschritte zu fördern.
Ihre Lösung? KI muss auf eine erfahrungsbasiertere Weise mit der Welt interagieren, aus Interaktionen lernen und Ziele basierend auf Umweltfeedback setzen. „Unglaubliche neue Fähigkeiten werden entstehen, sobald das volle Potenzial des erfahrungsbasierten Lernens ausgeschöpft ist“, behaupten sie. Silver, bekannt für seine Arbeit an AlphaZero, das Menschen im Schach und Go besiegt hat, und Sutton, ein Pionier des bestärkenden Lernens, schlagen einen neuen Ansatz namens „Streams“ vor, um die Grenzen aktueller großer Sprachmodelle (LLMs) zu überwinden.
Vom bestärkenden Lernen zur generativen KI: Ein Wandel und seine Folgen
Nach den Erfolgen von AlphaZero und AlphaGo sah die KI-Gemeinschaft einen Wandel hin zu generativen KI-Modellen wie ChatGPT, die weitgehend vom bestärkenden Lernen weggegangen sind. Während dies der KI ermöglichte, ein breiteres Spektrum spontaner menschlicher Eingaben zu verarbeiten, bedeutete es auch den Verlust des Aspekts der Selbstentdeckung, den das bestärkende Lernen ermöglichte.
Laut Silver und Sutton stützen sich aktuelle LLMs stark auf menschliches Urteilsvermögen in der Prompt-Phase, was ihr Potenzial einschränkt. „Der Agent kann keine besseren Strategien entdecken, die vom menschlichen Bewerter unterschätzt werden“, erklären sie. Darüber hinaus erlaubt die kurze, abgehackte Natur von Prompt-Interaktionen der KI nicht, über einfache Frage-und-Antwort-Austausche hinauszugehen.
Einführung von Streams: Ein neues Paradigma für das KI-Lernen
Das vorgeschlagene „Zeitalter der Erfahrung“ beinhaltet KI-Agenten, die innerhalb von „Streams“ kontinuierlicher Interaktion operieren, ähnlich wie Menschen über ein Leben lang lernen. Silver und Sutton stellen sich KI-Agenten mit ihren eigenen langfristigen Erfahrungsströmen vor, die es ihnen ermöglichen, Ziele über unmittelbare Aufgaben hinaus zu verfolgen.
Dieser Ansatz baut auf bestärkendem Lernen auf, bei dem KI-Agenten mit einem Weltmodell interagieren und Rückmeldungen in Form von Belohnungen erhalten. Diese Belohnungen helfen der KI zu lernen, welche Aktionen in verschiedenen Kontexten wertvoll sind. Die Forscher weisen darauf hin, dass die Welt reich an Signalen ist, die als Belohnungen dienen können, von wirtschaftlichen Indikatoren bis hin zu Gesundheitsmetriken.
Aufbau von KI-Agenten mit langfristigen Zielen
Um diesen Prozess zu starten, könnten KI-Entwickler eine „Weltmodell“-Simulation verwenden, die es der KI ermöglicht, Vorhersagen zu treffen, diese in der Realität zu testen und ihr Modell basierend auf den Ergebnissen zu verfeinern. Während die KI weiterhin mit der Welt interagiert, entwickelt sich ihr Verständnis weiter, passt sich neuen Daten an und korrigiert Fehler.
Menschen würden weiterhin eine Rolle dabei spielen, breite Ziele festzulegen, wie etwa die Verbesserung der Fitness oder das Erlernen einer neuen Sprache, wobei die Belohnungsfunktion der KI auf diese Ziele ausgerichtet ist. Dieses Setup könnte zu KI-Assistenten führen, die über längere Zeiträume hinweg Gesundheit oder Bildung verfolgen und beraten oder sogar ehrgeizige wissenschaftliche Ziele wie die Entdeckung neuer Materialien oder die Reduzierung von Kohlenstoffemissionen verfolgen.
Die Zukunft der KI: Über das Denken hinaus zum erfahrungsbasierten Lernen
Die Forscher glauben, dass KI-Agenten, die zu langfristigem erfahrungsbasiertem Lernen fähig sind, aktuelle „denkende“ KI-Modelle wie Gemini und DeepSeeks R1 übertreffen könnten. Sie argumentieren, dass denkende Modelle oft menschliches Denken nachahmen, was durch veraltete Annahmen eingeschränkt sein kann. Im Gegensatz dazu könnten erfahrungsbasierte Agenten beispiellose Fähigkeiten freisetzen, die zu einer Zukunft führen, die sich stark von dem unterscheidet, was wir bisher gesehen haben.
Dieser Wandel bringt jedoch auch Risiken mit sich, wie etwa Arbeitsplatzverluste und die Herausforderung, KI-Agenten zu kontrollieren, die über lange Zeiträume autonom operieren können. Auf der anderen Seite könnte anpassungsfähige KI lernen, negative Auswirkungen auf Menschen zu mildern, indem sie ihr Verhalten basierend auf Feedback anpasst.
Silver und Sutton sind überzeugt, dass erfahrungsbasierte Daten die Skala und Qualität menschlich generierter Daten bei weitem übertreffen werden, was potenziell zu künstlicher allgemeiner Intelligenz oder Superintelligenz führen könnte. Dieser Paradigmenwechsel, gekoppelt mit Fortschritten im bestärkenden Lernen, könnte neue Fähigkeiten freisetzen, die in vielen Bereichen jenseits menschlicher Reichweite liegen.
Silver diskutierte diese Ideen kürzlich in einem DeepMind-Podcast und beleuchtete das Potenzial und die Herausforderungen, KI in das Zeitalter der Erfahrung zu führen.




AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀




AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀




Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?




This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!




AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!




¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!












