Option
Heim
Nachricht
Anthropische Behauptungen KI hängen nicht auf, es ist überlistet Benchmarks

Anthropische Behauptungen KI hängen nicht auf, es ist überlistet Benchmarks

17. April 2025
108

Anthropische Behauptungen KI hängen nicht auf, es ist überlistet Benchmarks

Große Sprachmodelle (LLMs) und andere generative KI-Technologien machen bedeutende Fortschritte bei der Selbstkorrektur, was den Weg für neue Anwendungen ebnet, einschließlich dessen, was als „agentische KI“ bekannt ist, so Michael Gerstenhaber, Vizepräsident von Anthropic, einem führenden Entwickler von KI-Modellen.

„Es wird sehr gut in Selbstkorrektur und Selbstbegründung“, teilte Gerstenhaber, der die API-Technologien bei Anthropic leitet, in einem Interview in New York mit Anurag Rana von Bloomberg Intelligence mit. Anthropic, Schöpfer der Claude-Familie von LLMs, sind direkte Konkurrenten der GPT-Modelle von OpenAI. „Alle paar Monate veröffentlichen wir ein neues Modell, das die Fähigkeiten von LLMs erweitert“, fügte er hinzu und betonte die dynamische Natur der Branche, in der jede Modellüberarbeitung neue potenzielle Anwendungen freischaltet.

Neue Fähigkeiten in KI-Modellen

Die neuesten Modelle von Anthropic haben Fähigkeiten wie Aufgabenplanung eingeführt, die es ihnen ermöglichen, Aufgaben an einem Computer ähnlich wie ein Mensch auszuführen, wie zum Beispiel das Online-Bestellen einer Pizza. „Das Planen von Zwischenschritten, etwas, das gestern noch nicht machbar war, ist jetzt in Reichweite“, bemerkte Gerstenhaber zu dieser schrittweisen Aufgabenausführung.

Die Diskussion, an der auch Vijay Karunamurthy, Chief Technologist beim KI-Startup Scale AI, teilnahm, war Teil einer ganztägigen Konferenz, die von Bloomberg Intelligence veranstaltet wurde und den Titel „Gen AI: Kann sie ihr Produktivitätsversprechen einlösen?“ trug.

Herausforderung des KI-Skeptizismus

Gerstenhabers Einblicke stellen die Ansichten von KI-Skeptikern infrage, die argumentieren, dass generative KI und das breitere KI-Feld „an eine Wand stoßen“ und mit jeder neuen Modelliteration abnehmende Erträge liefern. Der KI-Wissenschaftler Gary Marcus zum Beispiel äußert seit 2022 lautstark seine Bedenken und warnt, dass die bloße Vergrößerung der KI-Modelle (mehr Parameter) ihre Leistung nicht proportional verbessern wird.

Gerstenhaber beteuert jedoch, dass Anthropic die Grenzen dessen überschreitet, was aktuelle KI-Benchmarks messen können. „Selbst wenn es so aussieht, als würde der Fortschritt in einigen Bereichen nachlassen, liegt das daran, dass wir völlig neue Funktionalitäten freischalten, aber die Benchmarks und die Fähigkeit, ältere Aufgaben auszuführen, gesättigt haben“, erklärte er. Dies macht es zunehmend schwierig, das volle Ausmaß dessen zu beurteilen, was aktuelle generative KI-Modelle erreichen können.

Skalierung und Lernen

Sowohl Gerstenhaber als auch Karunamurthy betonten die Bedeutung der Skalierung generativer KI-Modelle, um deren Selbstkorrekturfähigkeiten zu verbessern. „Wir sehen definitiv eine zunehmende Skalierung der Intelligenz“, bemerkte Gerstenhaber. Karunamurthy fügte hinzu: „Ein Grund, warum wir glauben, dass wir bei Planung und Begründung nicht an eine Wand stoßen, ist, dass wir noch lernen, wie wir diese Aufgaben so strukturieren können, dass die Modelle sich an neue und vielfältige Umgebungen anpassen können.“

Gerstenhaber stimmte zu und erklärte: „Wir befinden uns in den Anfängen und lernen von Anwendungsentwicklern über ihre Bedürfnisse und wo die Modelle Schwächen zeigen, die wir dann wieder in das Sprachmodell integrieren können.“

Echtzeitlernen und Anpassung

Vieles von diesem Fortschritt, so Gerstenhaber, wird durch das schnelle Tempo der Grundlagenforschung bei Anthropic sowie durch Echtzeitlernen aus dem Feedback der Industrie angetrieben. „Wir passen uns an das an, was die Industrie uns sagt, dass sie braucht, und lernen in Echtzeit“, sagte er.

Kunden beginnen oft mit größeren Modellen und skalieren dann auf einfachere herunter, um spezifischen Zwecken zu entsprechen. „Zunächst bewerten sie, ob ein Modell intelligent genug ist, um eine Aufgabe gut auszuführen, dann ob es schnell genug ist, um ihre Anwendungsanforderungen zu erfüllen, und schließlich, ob es so kosteneffizient wie möglich sein kann“, erklärte Gerstenhaber.

Verwandter Artikel
KI-gestützte Musikerstellung: Songs und Videos mühelos erstellen KI-gestützte Musikerstellung: Songs und Videos mühelos erstellen Musikerstellung kann komplex sein und erfordert Zeit, Ressourcen und Fachwissen. Künstliche Intelligenz hat diesen Prozess revolutioniert und ihn einfach und zugänglich gemacht. Dieser Leitfaden zeigt
Erstellung KI-gestützter Malbücher: Ein umfassender Leitfaden Erstellung KI-gestützter Malbücher: Ein umfassender Leitfaden Das Gestalten von Malbüchern ist ein lohnendes Unterfangen, das künstlerischen Ausdruck mit beruhigenden Erlebnissen für Nutzer verbindet. Der Prozess kann jedoch arbeitsintensiv sein. Glücklicherweis
Qodo Partnerschaft mit Google Cloud zur Bereitstellung kostenloser KI-Code-Review-Tools für Entwickler Qodo Partnerschaft mit Google Cloud zur Bereitstellung kostenloser KI-Code-Review-Tools für Entwickler Qodo, ein in Israel ansässiges KI-Startup für Codierung, das sich auf Codequalität konzentriert, hat eine Partnerschaft mit Google Cloud gestartet, um die Integrität von KI-generiertem Softwarecode zu
Kommentare (8)
0/200
JoseRoberts
JoseRoberts 12. August 2025 17:00:59 MESZ

This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?

WalterAnderson
WalterAnderson 31. Juli 2025 13:35:39 MESZ

It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!

RonaldMartinez
RonaldMartinez 22. Juli 2025 09:39:52 MESZ

This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄

WillieJackson
WillieJackson 18. April 2025 09:00:28 MESZ

La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔

GeorgeWilson
GeorgeWilson 17. April 2025 19:45:24 MESZ

Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔

NicholasCarter
NicholasCarter 17. April 2025 13:27:31 MESZ

Anthropic's take on AI not stalling but outsmarting benchmarks is pretty cool. It's like AI is playing chess while we're still figuring out checkers. The self-correction stuff sounds promising, but I'm still a bit skeptical. 🤔

Zurück nach oben
OR