Option
Heim
Nachricht
Anthropische Behauptungen KI hängen nicht auf, es ist überlistet Benchmarks

Anthropische Behauptungen KI hängen nicht auf, es ist überlistet Benchmarks

17. April 2025
161

Anthropische Behauptungen KI hängen nicht auf, es ist überlistet Benchmarks

Große Sprachmodelle (LLMs) und andere generative KI-Technologien machen bedeutende Fortschritte bei der Selbstkorrektur, was den Weg für neue Anwendungen ebnet, einschließlich dessen, was als „agentische KI“ bekannt ist, so Michael Gerstenhaber, Vizepräsident von Anthropic, einem führenden Entwickler von KI-Modellen.

„Es wird sehr gut in Selbstkorrektur und Selbstbegründung“, teilte Gerstenhaber, der die API-Technologien bei Anthropic leitet, in einem Interview in New York mit Anurag Rana von Bloomberg Intelligence mit. Anthropic, Schöpfer der Claude-Familie von LLMs, sind direkte Konkurrenten der GPT-Modelle von OpenAI. „Alle paar Monate veröffentlichen wir ein neues Modell, das die Fähigkeiten von LLMs erweitert“, fügte er hinzu und betonte die dynamische Natur der Branche, in der jede Modellüberarbeitung neue potenzielle Anwendungen freischaltet.

Neue Fähigkeiten in KI-Modellen

Die neuesten Modelle von Anthropic haben Fähigkeiten wie Aufgabenplanung eingeführt, die es ihnen ermöglichen, Aufgaben an einem Computer ähnlich wie ein Mensch auszuführen, wie zum Beispiel das Online-Bestellen einer Pizza. „Das Planen von Zwischenschritten, etwas, das gestern noch nicht machbar war, ist jetzt in Reichweite“, bemerkte Gerstenhaber zu dieser schrittweisen Aufgabenausführung.

Die Diskussion, an der auch Vijay Karunamurthy, Chief Technologist beim KI-Startup Scale AI, teilnahm, war Teil einer ganztägigen Konferenz, die von Bloomberg Intelligence veranstaltet wurde und den Titel „Gen AI: Kann sie ihr Produktivitätsversprechen einlösen?“ trug.

Herausforderung des KI-Skeptizismus

Gerstenhabers Einblicke stellen die Ansichten von KI-Skeptikern infrage, die argumentieren, dass generative KI und das breitere KI-Feld „an eine Wand stoßen“ und mit jeder neuen Modelliteration abnehmende Erträge liefern. Der KI-Wissenschaftler Gary Marcus zum Beispiel äußert seit 2022 lautstark seine Bedenken und warnt, dass die bloße Vergrößerung der KI-Modelle (mehr Parameter) ihre Leistung nicht proportional verbessern wird.

Gerstenhaber beteuert jedoch, dass Anthropic die Grenzen dessen überschreitet, was aktuelle KI-Benchmarks messen können. „Selbst wenn es so aussieht, als würde der Fortschritt in einigen Bereichen nachlassen, liegt das daran, dass wir völlig neue Funktionalitäten freischalten, aber die Benchmarks und die Fähigkeit, ältere Aufgaben auszuführen, gesättigt haben“, erklärte er. Dies macht es zunehmend schwierig, das volle Ausmaß dessen zu beurteilen, was aktuelle generative KI-Modelle erreichen können.

Skalierung und Lernen

Sowohl Gerstenhaber als auch Karunamurthy betonten die Bedeutung der Skalierung generativer KI-Modelle, um deren Selbstkorrekturfähigkeiten zu verbessern. „Wir sehen definitiv eine zunehmende Skalierung der Intelligenz“, bemerkte Gerstenhaber. Karunamurthy fügte hinzu: „Ein Grund, warum wir glauben, dass wir bei Planung und Begründung nicht an eine Wand stoßen, ist, dass wir noch lernen, wie wir diese Aufgaben so strukturieren können, dass die Modelle sich an neue und vielfältige Umgebungen anpassen können.“

Gerstenhaber stimmte zu und erklärte: „Wir befinden uns in den Anfängen und lernen von Anwendungsentwicklern über ihre Bedürfnisse und wo die Modelle Schwächen zeigen, die wir dann wieder in das Sprachmodell integrieren können.“

Echtzeitlernen und Anpassung

Vieles von diesem Fortschritt, so Gerstenhaber, wird durch das schnelle Tempo der Grundlagenforschung bei Anthropic sowie durch Echtzeitlernen aus dem Feedback der Industrie angetrieben. „Wir passen uns an das an, was die Industrie uns sagt, dass sie braucht, und lernen in Echtzeit“, sagte er.

Kunden beginnen oft mit größeren Modellen und skalieren dann auf einfachere herunter, um spezifischen Zwecken zu entsprechen. „Zunächst bewerten sie, ob ein Modell intelligent genug ist, um eine Aufgabe gut auszuführen, dann ob es schnell genug ist, um ihre Anwendungsanforderungen zu erfüllen, und schließlich, ob es so kosteneffizient wie möglich sein kann“, erklärte Gerstenhaber.

Verwandter Artikel
Hauptinvestor von Suno: Das Löschen von Beiträgen wird die Lücke bei Urheberrechtsklagen nicht schließen Hauptinvestor von Suno: Das Löschen von Beiträgen wird die Lücke bei Urheberrechtsklagen nicht schließen Die mit Spannung erwartete KI-Plattform zur Musikgenerierung „Suno“ steht vor einem harten Rechtsstreit um Urheberrechte, und eine unverblümte Äußerung ihres Hauptinvestors könnte der Gegenseite genau
Claude Opus 4.7 startet mit dem Grundsatz, dass Zuverlässigkeit vor Intelligenz geht Claude Opus 4.7 startet mit dem Grundsatz, dass Zuverlässigkeit vor Intelligenz geht Anthropic hat in diesem Jahr ein hohes Tempo beibehalten und fast jeden zweiten Tag neue Funktionen eingeführt. Das mit Spannung erwartete Claude Opus 4.7 wurde soeben offiziell veröffentlicht, und in
Haier bringt den weltweit leichtesten KI-Sport-Exoskelett-Roboter mit einem Gewicht von nur 1,75 kg auf den Markt Haier bringt den weltweit leichtesten KI-Sport-Exoskelett-Roboter mit einem Gewicht von nur 1,75 kg auf den Markt Die Haier Group hat den weltweit leichtesten KI-gestützten Exoskelett-Roboter für den Sport vorgestellt – den Haier Exoskeleton Robot W3. Diese Markteinführung stellt einen neuen Branchenrekord in Sac
Empfehlungen zu verwandten Spezialthemen
Comic-Erstellung Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte
Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte

Entdecken Sie bei XIX.AI die besten KI-Generatoren für Shonen-Manga des Jahres 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools zur Erstellung actiongeladener Sequenzen und dynamischer Energieeffekte. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie Ihr kreatives Potenzial und beginnen Sie noch heute mit der Gestaltung epischer Manga!

15 Tools
xix.ai
Geschäft Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren
Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren

Die besten KI-basierten Spesenmanager 2026: Erstklassige Tools zum Scannen von Belegen und zur automatischen Kategorisierung von Unternehmensausgaben. Entdecken Sie leistungsstarke, bahnbrechende Lösungen für müheloses Spesenmanagement, präzise Finanzüberwachung und optimierte Compliance. Unser sorgfältig zusammengestellter, wöchentlich aktualisierter Vergleich zwischen kostenlosen und kostenpflichtigen Optionen hilft Ihnen dabei, die perfekte Lösung zu finden. Nutzen Sie Ihren KI-Vorteil mit den Expertenempfehlungen von XIX.AI.

10 Tools
xix.ai
Geschäft Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren
Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren

Entdecken Sie auf XIX.AI die besten KI-Tools für die Personalbeschaffung des Jahres 2026. Unsere sorgfältig zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Lösungen für die Sichtung von Lebensläufen und die automatisierte Terminplanung für Vorstellungsgespräche. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihren perfekten Assistenten für die Personalbeschaffung und optimieren Sie noch heute Ihren Rekrutierungsprozess!

10 Tools
xix.ai
Produktivität KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern
KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern

Entdecken Sie auf XIX.AI die besten KI-basierten Coaches für persönliches Wohlbefinden und Konzentration des Jahres 2026. Unsere sorgfältig zusammengestellte Rangliste umfasst erstklassige, bahnbrechende Tools zur Bewältigung von Burnout und zur Steigerung der mentalen Energie. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Schlagen Sie noch heute den Weg zu höchster Produktivität und Wohlbefinden ein.

10 Tools
xix.ai
Chatbot Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf
Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf

Entdecken Sie die besten KI-Romantik-Chatbots des Jahres 2026, mit denen Sie echte, langfristige Beziehungen aufbauen können. Unsere sorgfältig zusammengestellte Liste bietet Ihnen überzeugende, konsistente Persönlichkeiten, Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten sowie Tests aus der Praxis. Finden Sie Ihren perfekten Begleiter und legen Sie noch heute bei XIX.AI los.

10 Tools
xix.ai
Bildung und Lernen Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.
Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.

Entdecken Sie die besten AI-Data-Science-Mentoren von 2026, um SQL, Pandas und ML-Arbeitsabläufe zu meistern. Erfahren Sie mehr über unsere hochbewerteten, sorgfältig ausgewählten Angebote bei XIX.AI – für effektive und bahnbrechende Anleitung. Vergleichen Sie kostenlose und bezahlte Optionen mit praktischen Einblicken aus der Praxis. Entfalten Sie Ihr Potenzial in der Data Science noch heute.

10 Tools
xix.ai
Kommentare (8)
0/500
JoseRoberts
JoseRoberts 12. August 2025 17:00:59 MESZ

This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?

WalterAnderson
WalterAnderson 31. Juli 2025 13:35:39 MESZ

It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!

RonaldMartinez
RonaldMartinez 22. Juli 2025 09:39:52 MESZ

This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄

WillieJackson
WillieJackson 18. April 2025 09:00:28 MESZ

La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔

GeorgeWilson
GeorgeWilson 17. April 2025 19:45:24 MESZ

Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔

NicholasCarter
NicholasCarter 17. April 2025 13:27:31 MESZ

Anthropic's take on AI not stalling but outsmarting benchmarks is pretty cool. It's like AI is playing chess while we're still figuring out checkers. The self-correction stuff sounds promising, but I'm still a bit skeptical. 🤔

OR