Option
Heim
Nachricht
Google sagt, Gemini 2.5 Pro übertrifft DeepSeek R1 und Grok 3 Beta in Coding Benchmarks

Google sagt, Gemini 2.5 Pro übertrifft DeepSeek R1 und Grok 3 Beta in Coding Benchmarks

24. Oktober 2025
110

Google hat eine aktualisierte Vorschau seines Flaggschiffmodells Gemini 2.5 Pro vorgestellt, das ursprünglich im März eingeführt und im Mai verbessert wurde. Diese Iteration, die als die bisher "intelligenteste" KI des Unternehmens beschrieben wird, befindet sich derzeit in der Vorschau und soll in den nächsten Wochen allgemein verfügbar sein.

Unternehmen können jetzt mit der Entwicklung neuer Anwendungen experimentieren oder bestehende Implementierungen mit der aktualisierten I/O-Edition" von Gemini 2.5 Pro aktualisieren. Laut Googles offizieller Ankündigung liefert diese Version phantasievollere Antworten und demonstriert im Vergleich zu früheren Versionen bessere Fähigkeiten in der Programmierung und im logischen Denken.

Unser neuestes Gemini 2.5 Pro Update ist jetzt in der Vorschau.

Es ist besser in Programmierung, logischem Denken, Wissenschaft und Mathematik, zeigt eine verbesserte Leistung in wichtigen Benchmarks (AIDER Polyglot, GPQA, HLE, um nur einige zu nennen) und führt @lmarena_ai mit einem Elo-Sprung von 24 Punkten seit der vorherigen Version an.

Wir haben auch... pic.twitter.com/SVjdQ2k1tJ

- Sundar Pichai (@sundarpichai) June 5, 2025

Auf seiner Entwicklerkonferenz im Mai enthüllte Google Verbesserungen an Gemini 2.5 Pro, die die frühere stille Version übertrafen. Demis Hassabis, CEO von Google DeepMind, hob die I/O-Ausgabe als das bisher fortschrittlichste Kodierungsmodell des Unternehmens hervor.

Diese neueste Vorschau, die als Gemini 2.5 Pro Preview 06-05 Thinking bezeichnet wird, geht über die Fähigkeiten der I/O-Edition hinaus. Die bevorstehende öffentliche Version verspricht Leistung und Skalierbarkeit auf Unternehmensniveau.

Die ursprüngliche I/O-Edition (gemini-2.5-pro-preview-05-06) wurde im Mai über Google AI Studio und Vertex AI für Entwickler und Unternehmen zugänglich gemacht. Die verbesserte Gemini 2.5 Pro Preview 06-05 Thinking ist über dieselben Kanäle erhältlich.

Leistungsmetriken

Dieses verbesserte Gemini 2.5 Pro weist messbare Verbesserungen gegenüber seinem Vorgänger auf.

Google meldete eine Verbesserung um 24 Punkte in LMArena und einen Zuwachs um 35 Punkte in WebDevArena, wo es nun die Rangliste der Wettbewerber anführt. Vergleichstests zeigten eine überlegene Leistung gegenüber Modellen wie o3, o3-mini und o4-mini von OpenAI, Claude 4 Opus von Anthropic, Grok 3 Beta von xAI und DeepSeek R1.

"Wir haben auch auf das Feedback unserer früheren 2.5 Pro-Versionen reagiert und den Stil und die Struktur verbessert - es kann kreativer sein mit besser formatierten Antworten", so Google in seiner Ankündigung.

Was Unternehmen erwarten können

Googles schnelle Gemini 2.5 Pro-Verbesserungen mögen zwar komplex erscheinen, aber das Unternehmen stellt sie als direkte Reaktionen auf Nutzereingaben dar. Die neue Version hat eine Preisstruktur von 1,25 US-Dollar pro Million Input-Token (ohne Caching) und 10 US-Dollar pro Million Output-Token.

Als Gemini 2.5 Pro im März auf den Markt kam, wurde es von Branchenbeobachtern als ein nicht ausreichend genutztes fortschrittliches Modell angesehen. Google hat die Technologie seitdem in zahlreiche Anwendungen integriert, darunter die Funktion "Deep Think", die mehrere Hypothesen bewertet, bevor sie Antworten generiert.

Die Veröffentlichung von Gemini 2.5 Pro und die darauf folgenden Upgrades haben Googles Position in der wettbewerbsintensiven Landschaft der großen Sprachmodelle gestärkt und die Aufmerksamkeit der konkurrierenden Denkmodelle von DeepSeek und OpenAI zurückgewonnen.

Bereits wenige Stunden nach der Ankündigung begannen die Entwickler mit dem Testen des aktualisierten Gemini 2.5 Pro. Die ersten Eindrücke bestätigen Googles Behauptungen über die beschleunigte Leistung, auch wenn eine umfassende Bewertung der verbesserten Fähigkeiten noch aussteht.

Erste Stunde mit "Gemini 2.5 Pro Preview 06-05"

Positiv:

- Es ist schneller
- Es produziert mehr Output
- Bessere Makro-Wiedergabe (Bearbeitung von mehreren Dateien, bessere Übersicht)
- Die Ausgabestruktur ist besser (lesbar)
- Es ist prägnanter und WENIGER APOLOGETISCH!!

Vorher: "Sie sind absolut...

- Patrick Bade (@nishffx) 5. Juni 2025

Ihr habt gekocht, der App-Builder gefällt mir sehr gut.

Ich habe ein Spiel gemacht und es getestet, es hat imagen benutzt, um Assets on the fly zu erstellen ? und es ist fertig, gehostet, einfach zu teilen. Wirklich der beste No-Code-Builder ohne Erfahrung.

Wenn wir den Vibe-App-Marktplatz weiter ausbauen, könnte das...

- bone (@boneGPT) 5. Juni 2025

Gemini 2.5 Pro Preview ist ziemlich gut.. habe es gestern für tiefgreifende Recherchen verwendet und die Ergebnisse sind besser als einige der großen Namen...

- Janak (@janaks09) 5. Juni 2025

Verwandter Artikel
Google führt Gemini in Chrome in Indien ein Google führt Gemini in Chrome in Indien ein Am Mittwoch gab Google bekannt, dass es die Integration von Gemini in Chrome auf neue Regionen ausweitet, darunter Indien, Kanada und Neuseeland. Durch diese Einführung können Desktop-Nutzer über eine
YouTube weitet die KI-basierte Deepfake-Erkennung auf Politiker, Regierungsvertreter und Journalisten aus YouTube weitet die KI-basierte Deepfake-Erkennung auf Politiker, Regierungsvertreter und Journalisten aus Am Dienstag gab YouTube bekannt, dass es seine Deepfake-Erkennungstechnologie auf eine ausgewählte Gruppe von Regierungsbeamten, politischen Kandidaten und Journalisten ausweiten wird. Das Tool identi
YouTube testet eine KI-gestützte Suchfunktion mit geführten Antworten YouTube testet eine KI-gestützte Suchfunktion mit geführten Antworten Viele Nutzer greifen auf YouTube zurück, wenn sie nach Rezepten oder Reiseplänen suchen, um relevante Videos zu finden. Nun führt die Plattform ein KI-gestütztes interaktives Suchtool ein, das Schritt
Empfehlungen zu verwandten Spezialthemen
Comic-Erstellung Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte
Die besten KI-Generatoren für Shonen-Manga: Erstelle actiongeladene Sequenzen und dynamische Effekte

Entdecken Sie bei XIX.AI die besten KI-Generatoren für Shonen-Manga des Jahres 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools zur Erstellung actiongeladener Sequenzen und dynamischer Energieeffekte. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Entfalten Sie Ihr kreatives Potenzial und beginnen Sie noch heute mit der Gestaltung epischer Manga!

15 Tools
xix.ai
Geschäft Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren
Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren

Die besten KI-basierten Spesenmanager 2026: Erstklassige Tools zum Scannen von Belegen und zur automatischen Kategorisierung von Unternehmensausgaben. Entdecken Sie leistungsstarke, bahnbrechende Lösungen für müheloses Spesenmanagement, präzise Finanzüberwachung und optimierte Compliance. Unser sorgfältig zusammengestellter, wöchentlich aktualisierter Vergleich zwischen kostenlosen und kostenpflichtigen Optionen hilft Ihnen dabei, die perfekte Lösung zu finden. Nutzen Sie Ihren KI-Vorteil mit den Expertenempfehlungen von XIX.AI.

10 Tools
xix.ai
Geschäft Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren
Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren

Entdecken Sie auf XIX.AI die besten KI-Tools für die Personalbeschaffung des Jahres 2026. Unsere sorgfältig zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Lösungen für die Sichtung von Lebensläufen und die automatisierte Terminplanung für Vorstellungsgespräche. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihren perfekten Assistenten für die Personalbeschaffung und optimieren Sie noch heute Ihren Rekrutierungsprozess!

10 Tools
xix.ai
Produktivität KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern
KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern

Entdecken Sie auf XIX.AI die besten KI-basierten Coaches für persönliches Wohlbefinden und Konzentration des Jahres 2026. Unsere sorgfältig zusammengestellte Rangliste umfasst erstklassige, bahnbrechende Tools zur Bewältigung von Burnout und zur Steigerung der mentalen Energie. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Schlagen Sie noch heute den Weg zu höchster Produktivität und Wohlbefinden ein.

10 Tools
xix.ai
Chatbot Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf
Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf

Entdecken Sie die besten KI-Romantik-Chatbots des Jahres 2026, mit denen Sie echte, langfristige Beziehungen aufbauen können. Unsere sorgfältig zusammengestellte Liste bietet Ihnen überzeugende, konsistente Persönlichkeiten, Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten sowie Tests aus der Praxis. Finden Sie Ihren perfekten Begleiter und legen Sie noch heute bei XIX.AI los.

10 Tools
xix.ai
Bildung und Lernen Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.
Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.

Entdecken Sie die besten AI-Data-Science-Mentoren von 2026, um SQL, Pandas und ML-Arbeitsabläufe zu meistern. Erfahren Sie mehr über unsere hochbewerteten, sorgfältig ausgewählten Angebote bei XIX.AI – für effektive und bahnbrechende Anleitung. Vergleichen Sie kostenlose und bezahlte Optionen mit praktischen Einblicken aus der Praxis. Entfalten Sie Ihr Potenzial in der Data Science noch heute.

10 Tools
xix.ai
Kommentare (1)
0/500
JohnYoung
JohnYoung 17. Mai 2026 02:00:11 MESZ

Interesting to see Google claiming coding benchmark wins, but I'm curious about real-world dev experience. Does it handle messy legacy codebases as well as it does clean competition problems? The 'most intelligent' tag feels a bit marketing-heavy until we see more hands-on results. 🤔

OR