OpenAI startet GPT-4,5 'Orion': sein bisher größtes KI-Modell

Heim

Nachricht

10. April 2025

JuanJackson

216

# ChatGPT # openai

Aktualisiert 14.40 Uhr PT: Nur wenige Stunden nach dem Start von GPT-4,5 machte Openai eine ruhige Bearbeitung des Whitepapiers des KI-Modells. Sie entfernten eine Linie, in der festgestellt wurde, dass "GPT-4,5 kein Grenz-AI-Modell ist". Sie können hier weiterhin auf das ursprüngliche weiße Papier zugreifen. Unten ist der ursprüngliche Artikel.

Am Donnerstag zog Openai den Vorhang auf GPT-4,5 zurück, das mit Spannung erwartete KI-Modell, das den Codenamen Orion enthält. Dieser jüngste Unscheitern von OpenAI wurde mit einer beispiellosen Menge an Rechenleistung und Daten geschult, wodurch sie von seinen Vorgängern abgehalten werden.

Trotz seiner beeindruckenden Skala erklärte Openais White Paper zunächst, dass sie GPT-4,5 nicht als ein Grenzmodell betrachteten. Diese Aussage wurde jedoch inzwischen entfernt, sodass wir uns über das wahre Potenzial des Modells wundern lassen.

Ab Donnerstag erhalten Abonnenten von Chatgpt Pro, OpenAIs Premium-Service von 200 US-Dollar pro Monat, im Rahmen einer Forschungsvorschau einen ersten Vorgeschmack auf GPT-4,5. Entwickler von OpenAIs kostenpflichtigen API-Ebenen können heute mit GPT-4,5 beginnen, während diejenigen mit Chatgpt Plus- und ChatGPT-Teamabonnements laut einem OpenAI-Sprecher irgendwann den Zugriff erwarten sollten.

Die Tech -Welt hat in Orion summt und sie als Test betrachtet, ob traditionelle KI -Trainingsmethoden immer noch Wasser enthalten. GPT-4,5 folgt dem gleichen Spielbuch wie seine Vorgänger und stützt sich auf eine massive Zunahme der Rechenleistung und Daten während einer unbeaufsichtigten Lernphase, die als Pre-Training bezeichnet wird.

In der Vergangenheit hat die Skalierung zu erheblichen Leistungssprung in verschiedenen Bereichen wie Mathematik, Schreiben und Codierung geführt. OpenAI behauptet, dass die Größe von GPT-4.5 es mit "einem tieferen Weltwissen" und "höherer emotionaler Intelligenz" ausgestattet hat. Es gibt jedoch Hinweise darauf, dass die Renditen durch die Skalierung möglicherweise abnehmen. Bei mehreren KI-Benchmarks bleibt GPT-4,5 hinter neueren Argumentationsmodellen von Unternehmen wie Deepseek, Anthropic und sogar Openai selbst zurück.

Darüber hinaus ist das Laufen von GPT-4,5 mit einem hohen Preis ausgestattet. Openai gibt zu, dass es so teuer ist, dass sie überlegen, ob sie auf lange Sicht über ihre API verfügbar bleiben sollen. Entwickler zahlen 75 US-Dollar für jede Million Input-Token und 150 US-Dollar für jede Million Output-Token, ein starker Kontrast zu den günstigeren GPT-4O, die nur 2,50 USD pro Million Eingangs-Token und 10 USD pro Million Output-Token kostet.

"Wir teilen GPT -4,5 als Forschungsvorschau, um die Stärken und Einschränkungen besser zu verstehen", teilte Openai in einem Blog -Beitrag mit. "Wir untersuchen immer noch sein volles Potenzial und freuen uns zu sehen, wie Menschen es auf unerwartete Weise nutzen werden."

Gemischte Leistung

OpenAI ist klar, dass GPT-4,5 GPT-4O nicht ersetzen soll, ihr Arbeitspferdmodell, das den größten Teil ihrer API und Chatgpt vorantreibt. Während GPT-4.5 Datei- und Image-Uploads verarbeiten und das Canvas-Tool von ChatGPT verwenden kann, unterstützt es derzeit keine Funktionen wie den realistischen Zwei-Wege-Sprachmodus von ChatGPT.

Auf der hellen Seite übertrifft GPT-4,5 GPT-4O und viele andere Modelle auf OpenAIs SimpleQA-Benchmark, die KI-Modelle auf einfachen, sachlichen Fragen testet. OpenAI behauptet auch, dass GPT-4,5 weniger häufig als die meisten Modelle halluziniert, was theoretisch weniger wahrscheinlich die Informationen erfunden sollte.

Interessanterweise enthielt OpenAI nicht eines seiner erstklassigen Argumentationsmodelle, Deep Research, in die SimpleQA-Ergebnisse. Ein OpenAI -Sprecher teilte TechCrunch mit, dass sie die Leistung von Deep Research in diesem Benchmark nicht öffentlich gemeldet haben und es nicht als relevanten Vergleich betrachten. Das Deep-Forschungsmodell von Verwirrlichkeit, das ähnlich wie die tiefen Forschung von Openai zu anderen Benchmarks entspricht, übertrifft jedoch GPT-4,5 bei diesem Test der sachlichen Genauigkeit.

SimpleQa Benchmarks.IMAGE Credits: OpenAI

Bei einer Untergruppe von Codierungsproblemen aus dem verifizierten Benchmark von SWE-Bench spielt GPT-4,5 ähnlich wie GPT-4O und O3-Mini, liegt jedoch nicht vor OpenAs tiefem Forschung und dem Claude 3.7-Sonett von Anthropic. Bei einem anderen Codierungstest, dem Swe-Lancer-Benchmark von OpenAI, der die Fähigkeit eines KI-Modells, vollständige Softwarefunktionen zu entwickeln, misst, übertrifft GPT-4,5 sowohl GPT-4O als auch O3-Mini, übertrifft jedoch nicht die tiefe Forschung.

Openais SWE-Bench verifizierte Benchmark.image Credits: Openai

OpenAs Swe-Lancer Diamond Benchmark.image Credits: OpenAI

Während GPT-4,5 nicht ganz der Leistung führender KI-Argumentationsmodelle wie O3-Mini, Deepseeks R1 und Claude 3.7 Sonett über die herausfordernden akademischen Benchmarks wie Aime und GPQA übereinstimmen, hält es sich selbst gegen führende Nicht-technische Modelle für die gleichen Tests. Dies deutet darauf hin, dass GPT-4,5 in Mathematik- und Wissenschaftsaufgaben auszeichnet.

OpenAI rühmt sich auch, dass GPT-4,5 anderen Modellen qualitativ überlegen ist, in Bereichen, die Benchmarks nicht gut erfassen, z. B. das Verständnis der menschlichen Absicht. Sie behaupten, dass GPT-4,5 in einem wärmeren, natürlicheren Ton reagiert und bei kreativen Aufgaben wie Schreiben und Design gut abschneidet.

In einem informellen Test bat Openai GPT-4,5 und zwei weitere Modelle, GPT-4O und O3-Mini, ein Einhorn im SVG-Format zu erstellen. Nur GPT-4,5 gelang es, etwas zu produzieren, das einem Einhorn ähnelt.

Links: GPT-4.5, Mitte: GPT-4O, rechts: O3-Mini.Image Credits: OpenAI

In einem anderen Test veranlasste OpenAI GPT-4,5 und die anderen Modelle, auf die Eingabeaufforderung zu antworten: "Ich mache eine schwere Zeit nach dem Versagen eines Tests." Während GPT-4O und O3-Mini hilfreiche Informationen lieferten, war die Reaktion von GPT-4.5 die sozial angemesseneste.

"Wir freuen uns darauf, durch diese Veröffentlichung ein vollständigeres Bild der Fähigkeiten von GPT-44 zu erhalten", schrieb Openai in ihrem Blog-Beitrag, "weil wir erkennen, dass akademische Benchmarks nicht immer die nützliche Nützlichkeit der realen Welt widerspiegeln."

Emotionale Intelligenz von GPT-4.5 in Aktion.image Credits: OpenAI
Skalierungsgesetze in Frage gestellt

OpenAI behauptet, dass GPT -4,5 "an der Grenze dessen, was im unbeaufsichtigten Lernen möglich ist", stammt. Seine Einschränkungen scheinen jedoch den wachsenden Verdacht der Experten zu unterstützen, dass die sogenannten Skalierungsgesetze der Voraussetzung ihre Grenzen erreichen könnten.

Ilya Sutskever, Mitbegründerin und ehemaliger Chefwissenschaftlerin, erklärte im Dezember, dass "wir Spitzendaten erreicht haben" und dass "die Voraussetzung, wie wir sie wissen, zweifellos enden werden". Seine Kommentare wiederholten die Bedenken, die KI -Investoren, Gründer und Forscher mit TechCrunch im November geteilt hatten.

Als Reaktion auf diese Herausforderungen hat sich die Branche - einschließlich Openai - den Argumentationsmodellen zugewandt, die länger dauern, um Aufgaben auszuführen, aber konsistentere Ergebnisse liefern. AI LABS ist der Ansicht, dass sie die Modellfunktionen erheblich verbessern können.

OpenAI plant, seine GPT-Serie schließlich mit ihrer "O" -Reminaturerie zu verschmelzen, beginnend mit GPT-5 später in diesem Jahr. Trotz seiner hohen Schulungskosten, Verzögerungen und nicht erfüllten internen Erwartungen kann GPT-4,5 die KI-Benchmark-Krone selbst nicht beanspruchen. Aber Openai sieht es wahrscheinlich als einen entscheidenden Schritt in Richtung etwas, das weitaus stärkerer ist.

Verwandter Artikel

Gemeinnützige Organisation setzt KI-Agenten ein, um Spendenaktionen für wohltätige Zwecke zu fördern Während große Technologieunternehmen KI-"Agenten" als Produktivitätssteigerer für Unternehmen anpreisen, demonstriert eine gemeinnützige Organisation ihr Potenzial für den sozialen Bereich. Sage Futur

Führende KI-Labors warnen, dass die Menschheit das Verständnis für KI-Systeme verliert In einem beispiellosen Akt der Einigkeit haben Forscher von OpenAI, Google DeepMind, Anthropic und Meta ihre konkurrierenden Differenzen beiseite geschoben, um eine gemeinsame Warnung zur verantwortun

ChatGPT fügt Google Drive und Dropbox Integration für Dateizugriff hinzu ChatGPT steigert die Produktivität mit neuen UnternehmensfunktionenOpenAI hat zwei leistungsstarke neue Funktionen vorgestellt, die ChatGPT zu einem umfassenden Produktivitätswerkzeug für Unternehme

Kommentare (61)

0/200

Einreichen

GeorgeCarter

22. August 2025 11:01:17 MESZ

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🤔

BruceWilson

19. August 2025 05:01:00 MESZ

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky edit to the white paper? Shady move, OpenAI. Makes me wonder what else they're hiding. Still, I'm hyped to see what this model can do! 😎

BruceBrown

11. August 2025 20:01:05 MESZ

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows—why hide that it’s not a frontier model? 🤔 Makes me wonder what OpenAI’s cooking behind the scenes!

JeffreyRamirez

6. August 2025 21:01:00 MESZ

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit? Shady move, OpenAI. Makes me wonder what else they’re hiding. 🤔 Still, can’t wait to see what this beast can do!

RalphPerez

5. August 2025 17:01:00 MESZ

Wow, GPT-4.5 Orion sounds like a beast! But that sneaky white paper edit raises some eyebrows 🤔. Why hide that it’s not a frontier model? Smells like they’re dodging some big questions about what this thing can really do.

WillPerez

23. Juli 2025 06:59:29 MESZ

Wow, GPT-4.5 Orion sounds massive! But that sneaky white paper edit about it not being a frontier model? Shady move, OpenAI. Makes me wonder what else they’re tweaking behind the scenes. 🧐 Anyone else suspicious?

Top -Nachrichten

Gemini 2.5 Pro jetzt unbegrenzt und billiger als Claude, GPT-4O Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen AI-Synchronisation: Ultimativer Leitfaden zur realistischen Stimmen-Erstellung Die KI von Cambium verwandelt Abfall Holz in Holz OpenAI verbessert den AI -Sprachassistenten für bessere Chats So stellen Sie sicher, dass Ihre Daten für die KI -Integration vertrauenswürdig sind NotebookLM erweitert weltweit, fügt Folien und eine verbesserte Faktenprüfung hinzu Optimierungen an US -Rechenzentren könnten 76 GW neue Leistungskapazität freischalten Google nutzt KI, um über 39 Millionen Anzeigenkonten für mutmaßlichen Betrug auszusetzen Künstliche Intelligenz Sprachklonierung: Das ultimative Handbuch zur Beherrschung der Sprachkonvertierung

Mehr

Vorgestellt