Option
Heim
Nachricht
Im Inneren von Googles AI-Sprung: Gemini 2.5 denkt tiefer, spricht intelligenter und codiert schneller

Im Inneren von Googles AI-Sprung: Gemini 2.5 denkt tiefer, spricht intelligenter und codiert schneller

7. Juni 2025
182

Im Inneren von Googles AI-Sprung: Gemini 2.5 denkt tiefer, spricht intelligenter und codiert schneller

Google zieht sich seinem Ziel eines universellen KI-Assistenten nähender

In diesem Jahr wurde bei der Google I/O Veranstaltung bedeutende Aktualisierungen der Gemini 2.5-Serie vorgestellt, wobei insbesondere auf Verbesserungen in verschiedenen Dimensionen fokussiert wurde. Die neuesten Versionen – Gemini 2.5 Flash und 2.5 Pro – sind nun schlauer und effizienter als je zuvor. Diese Fortschritte bringen Google seinem Ziel näher, einen universellen KI-Assistenten zu entwickeln, der im Kontext verstehen, planen und Aufgaben nahtlos ausführen kann. ### Gemini 2.5 Pro: Intelligenz auf neuer Höhe

Gemini 2.5 Pro, das von Google als sein fortschrittlichstes Modell bislang bezeichnet wird, verfügt über einen bislang uneinandergesetzten Kontextfenster von einer Million Tokens. Diese Funktion ermöglicht es der KI, große Datenmengen zu verarbeiten und längere Gespräche kohärent zu führen. Bei der Veranstaltung äußerte Demis Hassabis, CEO von Google DeepMind, Begeisterung über die erreichten Fortschritte und sagte: „Dies ist unser ultimatives Ziel für die Gemini-App: Eine KI, die persönlich, proaktiv und leistungsstark ist.“ Eine herausragende Funktion von Gemini 2.5 Pro ist die Einführung des experimentellen erweiterten Denkmodus „Deep Think“. Deep Think ermöglicht es der KI, mehrere Hypothesen zu analysieren, bevor sie eine Antwort liefert, wodurch ihre Entscheidungsfindung verbessert wird. Gemäß Hassabis geht dieser Fortschritt aus Erkenntnissen während der Entwicklung von AlphaGo hervor, wo längere Verarbeitungszeiten bessere Ergebnisse brachten. #### Beeindruckende Leistungen in Benchmarks

Deep Think hat bereits herausragende Leistungen in anspruchsvollen Benchmarks gezeigt. So erreichte es beeindruckende Werte beim USAMO (2025 USA Mathematical Olympiad) und übertraf Erwartungen im LiveCodeBench, einem Benchmark, der fortgeschrittene Programmierfähigkeiten testet. Darüber hinaus erzielte es 84,0 % im MMMU, das multimodale Verständnis und Logik evaluiert. Trotz dieser Errungenschaften bleibt Google vorsichtig. Hassabis erwähnte, dass das Team gründliche Sicherheitsprüfungen durchführt und Feedback von Experten einholt, bevor Deep Think breiter verfügbar gemacht wird. Derzeit ist es für vertrauenswürdige Tester über die API zugänglich, um Feedback einzusammeln. ### Gemini 2.5 Flash: Ein Arbeitpferd für den täglichen Gebrauch

Zusammen mit Gemini 2.5 Pro stellte Google auch eine verbesserte Version von Gemini 2.5 Flash vor, die für Geschwindigkeit, Effizienz und Wirtschaftlichkeit konzipiert wurde. Hassabis beschrieb es als das „Arbeitpferd“ der Serie, das in Benchmarks für Argumentation, Multimodalität, Code und lange Kontexte hervorragt. Tatsächlich rangiert es auf der LMArena-Leaderboard nur hinter Gemini 2.5 Pro. Das aktualisierte Flash-Modell ist etwa 20 bis 30 % effizienter und benötigt weniger Tokens, um Aufgaben auszuführen. Basierend auf Entwicklerfeedback optimierte Google das Modell und macht es für eine Vorschau in Google AI Studio, Vertex AI und der Gemini-App verfügbar. Es wird Mitte Juni für die Produktion vollständig bereitgestellt. ### Neue Funktionen in beiden Modellen

Sowohl Gemini 2.5 Pro als auch Flash erhielten mehrere neue Fähigkeiten, um die Benutzerinteraktion zu verbessern. Lokales Audiomaterial wurde hinzugefügt, um natürlichere Konversationserfahrungen zu ermöglichen, während die Text-zu-Sprechfunktion mehrere Stimmen unterstützt. Nutzer können sogar die Tonlage und den Stil der Sprache steuern, sei es melodramatisch oder ernsthaft. Andere experimentelle Sprachfunktionen umfassen affektives Dialogmanagement, das es der KI ermöglicht, Emotionen in der Stimme eines Benutzers zu erkennen und entsprechend zu reagieren, sowie proaktives Audio, das Hintergrundgeräusche filtert. Auch Thinking-Budgets wurden eingeführt, die Entwicklern Kontrolle über die Rechenleistung der KI geben, die vor der Antwort verwendet wird. ### Ein Schritt in die Zukunft

Diese Aktualisierungen unterstreichen Google’s Engagement, die Grenzen der KITechnologie zu erweitern. Wie Kavukcuoglu und Doshi in ihrem Blogpost bemerkten: „Wir erleben einen bemerkenswerten Moment in der Geschichte, wo AI eine fantastische neue Zukunft möglich macht. Es gab unaufhörliches Fortschreiten.“ Mit diesen Verbesserungen pflastert Google zweifellos den Weg zu einer Zukunft, in der KI-Assistenten unverzichtbare Begleiter in unserem Alltag werden.

Verwandter Artikel
Gemini Chatbot verbessert Bildbearbeitungsfunktionen Gemini Chatbot verbessert Bildbearbeitungsfunktionen Googles Gemini-Chatbot-App ermöglicht es Nutzern nun, KI-generierte und hochgeladene Bilder von Telefonen oder Computern zu bearbeiten, wie das Unternehmen in einem Blogbeitrag am Mittwoch ankündigte.
Google stellt Deep Think vor, um die Leistung von Gemini AI zu verbessern Google stellt Deep Think vor, um die Leistung von Gemini AI zu verbessern Google verbessert seine erstklassigen Gemini AI-Modelle.Beim Google I/O 2025 am Dienstag stellte das Unternehmen Deep Think vor, einen fortschrittlichen Denkmodus für sein führendes Gemini 2.5 Pro-Mod
KI-gestütztes Einzelhandelsexperiment scheitert spektakulär bei Anthropic KI-gestütztes Einzelhandelsexperiment scheitert spektakulär bei Anthropic Stellen Sie sich vor, Sie übergeben einen kleinen Laden einer künstlichen Intelligenz und vertrauen ihr alles an, von der Preisgestaltung bis zur Kundeninteraktion. Was könnte schiefgehen?Eine kürzlic
Kommentare (0)
0/200
Zurück nach oben
OR