Im Inneren von Googles AI-Sprung: Gemini 2.5 denkt tiefer, spricht intelligenter und codiert schneller

Heim

Nachricht

7. Juni 2025

AlbertJackson

194

# Gemini # nlp

Im Inneren von Googles AI-Sprung: Gemini 2.5 denkt tiefer, spricht intelligenter und codiert schneller

Google kommt seiner Vision eines universellen KI-Assistenten immer näher

Auf der diesjährigen Google I/O-Veranstaltung hat das Unternehmen bedeutende Upgrades seiner Gemini 2.5-Serie vorgestellt, die sich insbesondere auf die Verbesserung der Fähigkeiten in verschiedenen Dimensionen konzentrieren. Die neuesten Versionen - Gemini 2.5 Flash und 2.5 Pro - sind jetzt intelligenter und effizienter als je zuvor. Diese Fortschritte bringen Google seiner Vision näher, einen universellen KI-Assistenten zu schaffen, der in der Lage ist, den Kontext zu verstehen, zu planen und Aufgaben nahtlos auszuführen.

Gemini 2.5 Pro: Intelligenz in neuen Dimensionen

Gemini 2.5 Pro, das von Google als sein bisher fortschrittlichstes Modell angepriesen wird, verfügt über ein beispielloses Kontextfenster mit einer Million Token. Diese Funktion ermöglicht es der KI, riesige Datenmengen zu verarbeiten und die Kohärenz über längere Unterhaltungen hinweg aufrechtzuerhalten. Der CEO von Google DeepMind, Demis Hassabis, äußerte sich auf der Veranstaltung begeistert über die erzielten Fortschritte und erklärte: "Das ist unser ultimatives Ziel für die Gemini-App: Eine KI, die persönlich, proaktiv und leistungsstark ist." Eine der herausragenden Funktionen von Gemini 2.5 Pro ist die Einführung von Deep Think", einem experimentellen, erweiterten Denkmodus. Deep Think ermöglicht es der KI, mehrere Hypothesen zu analysieren, bevor sie eine Antwort gibt, und verbessert so ihre Entscheidungsfähigkeit. Laut Hassabis beruht diese Entwicklung auf den Erkenntnissen, die bei der Entwicklung von AlphaGo gewonnen wurden, wo längere Verarbeitungszeiten zu besseren Ergebnissen führten.

Beeindruckende Leistung bei Benchmark-Tests

Deep Think hat bereits bemerkenswerte Leistungen bei anspruchsvollen Benchmarks gezeigt. So erzielte es beispielsweise bei der Mathematik-Olympiade der USA (USAMO) 2025 beeindruckende Ergebnisse und glänzte bei LiveCodeBench, einem Benchmark, der dafür bekannt ist, Programmierkenntnisse auf hohem Niveau zu testen. Darüber hinaus erreichte es 84,0 % bei MMMU, einem Test, der das multimodale Verständnis und Denken bewertet. Trotz dieser Erfolge bleibt Google vorsichtig. Hassabis erwähnte, dass das Team gründliche Sicherheitsprüfungen durchführt und Feedback von Experten einholt, bevor es Deep Think auf breiterer Basis einführt. Derzeit ist Deep Think für vertrauenswürdige Tester über die API zugänglich, um Feedback zu erhalten.

Gemini 2.5 Flash: Ein Arbeitstier für den alltäglichen Gebrauch

Neben Gemini 2.5 Pro stellte Google auch eine verbesserte Version von Gemini 2.5 Flash vor, die auf Geschwindigkeit, Effizienz und Erschwinglichkeit ausgelegt ist. Hassabis bezeichnete sie als das "Arbeitstier" der Serie, das in den Benchmarks für logisches Denken, Multimodalität, Code und langen Kontext hervorragend abschneidet. Das aktualisierte Flash-Modell ist etwa 20 bis 30 % effizienter und benötigt weniger Token für die Ausführung von Aufgaben als Gemini 2.5 Pro auf der LMArena-Rangliste. Auf der Grundlage des Feedbacks von Entwicklern hat Google das Modell feinabgestimmt und für eine Vorschau in Google AI Studio, Vertex AI und der Gemini-App zur Verfügung gestellt. Es wird Anfang Juni vollständig in die Produktion übernommen.

Neue Funktionen für beide Modelle

Sowohl Gemini 2.5 Pro als auch Flash haben mehrere neue Funktionen erhalten, um die Interaktion mit dem Benutzer zu verbessern. Die native Audioausgabe wurde hinzugefügt, um ein natürlicheres Gesprächserlebnis zu schaffen, während die Text-to-Speech-Funktion jetzt mehrere Stimmen unterstützt. Der Benutzer kann sogar den Ton und den Stil der Sprache bestimmen, ob die KI melodramatisch oder düster klingen soll. Zu den weiteren experimentellen Sprachfunktionen gehören der affektive Dialog, der es der KI ermöglicht, Emotionen in der Stimme des Benutzers zu erkennen und entsprechend zu reagieren, sowie proaktives Audio, das Hintergrundgeräusche herausfiltert. Außerdem wurden Denkbudgets eingeführt, mit denen die Entwickler steuern können, wie viel Rechenleistung die KI verbraucht, bevor sie antwortet.

Ein Schritt in Richtung Zukunft

Diese Aktualisierungen unterstreichen das Engagement von Google, die Grenzen der KI-Technologie zu erweitern. Wie Kavukcuoglu und Doshi in ihrem Blog-Beitrag anmerken, "erleben wir einen bemerkenswerten Moment in der Geschichte, in dem die KI eine erstaunliche neue Zukunft ermöglicht. Mit diesen Verbesserungen ebnet Google zweifelsohne den Weg in eine Zukunft, in der KI-Assistenten zu unverzichtbaren Begleitern in unserem Alltag werden.

Verwandter Artikel

Verbessert die KI-Personalisierung die Realität oder verzerrt sie sie? Die versteckten Risiken erforscht Die menschliche Zivilisation hat schon früher kognitive Umwälzungen erlebt - die Handschrift hat das Gedächtnis externalisiert, die Taschenrechner haben das Rechnen automatisiert, GPS-Systeme haben di

Googles KI Gemini bezwingt Pokémon Blau mit Unterstützung Googles KI-Meilenstein: Eroberung eines klassischen Pokémon-AbenteuersGoogles fortschrittlichstes KI-Modell scheint einen bemerkenswerten Spieldurchbruch erzielt zu haben - es hat den Game Boy-Titel P

ByteDance enthüllt Seed-Thinking-v1.5 KI-Modell zur Verbesserung der Denkfähigkeiten Das Rennen um fortschrittliche denkende KI begann mit OpenAIs o1-Modell im September 2024 und gewann mit dem Start von DeepSeeks R1 im Januar 2025 an Dynamik.Wichtige KI-Entwickler konkurrieren nun da

Kommentare (0)

0/200

Einreichen

Top -Nachrichten

Gemini 2.5 Pro jetzt unbegrenzt und billiger als Claude, GPT-4O Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen AI-Synchronisation: Ultimativer Leitfaden zur realistischen Stimmen-Erstellung Die KI von Cambium verwandelt Abfall Holz in Holz OpenAI verbessert den AI -Sprachassistenten für bessere Chats So stellen Sie sicher, dass Ihre Daten für die KI -Integration vertrauenswürdig sind NotebookLM erweitert weltweit, fügt Folien und eine verbesserte Faktenprüfung hinzu Optimierungen an US -Rechenzentren könnten 76 GW neue Leistungskapazität freischalten Google nutzt KI, um über 39 Millionen Anzeigenkonten für mutmaßlichen Betrug auszusetzen Künstliche Intelligenz Sprachklonierung: Das ultimative Handbuch zur Beherrschung der Sprachkonvertierung

Mehr

Vorgestellt