

Im Inneren von Googles AI-Sprung: Gemini 2.5 denkt tiefer, spricht intelligenter und codiert schneller

Google zieht sich seinem Ziel eines universellen KI-Assistenten nähender
In diesem Jahr wurde bei der Google I/O Veranstaltung bedeutende Aktualisierungen der Gemini 2.5-Serie vorgestellt, wobei insbesondere auf Verbesserungen in verschiedenen Dimensionen fokussiert wurde. Die neuesten Versionen – Gemini 2.5 Flash und 2.5 Pro – sind nun schlauer und effizienter als je zuvor. Diese Fortschritte bringen Google seinem Ziel näher, einen universellen KI-Assistenten zu entwickeln, der im Kontext verstehen, planen und Aufgaben nahtlos ausführen kann. ### Gemini 2.5 Pro: Intelligenz auf neuer Höhe
Gemini 2.5 Pro, das von Google als sein fortschrittlichstes Modell bislang bezeichnet wird, verfügt über einen bislang uneinandergesetzten Kontextfenster von einer Million Tokens. Diese Funktion ermöglicht es der KI, große Datenmengen zu verarbeiten und längere Gespräche kohärent zu führen. Bei der Veranstaltung äußerte Demis Hassabis, CEO von Google DeepMind, Begeisterung über die erreichten Fortschritte und sagte: „Dies ist unser ultimatives Ziel für die Gemini-App: Eine KI, die persönlich, proaktiv und leistungsstark ist.“ Eine herausragende Funktion von Gemini 2.5 Pro ist die Einführung des experimentellen erweiterten Denkmodus „Deep Think“. Deep Think ermöglicht es der KI, mehrere Hypothesen zu analysieren, bevor sie eine Antwort liefert, wodurch ihre Entscheidungsfindung verbessert wird. Gemäß Hassabis geht dieser Fortschritt aus Erkenntnissen während der Entwicklung von AlphaGo hervor, wo längere Verarbeitungszeiten bessere Ergebnisse brachten. #### Beeindruckende Leistungen in Benchmarks
Deep Think hat bereits herausragende Leistungen in anspruchsvollen Benchmarks gezeigt. So erreichte es beeindruckende Werte beim USAMO (2025 USA Mathematical Olympiad) und übertraf Erwartungen im LiveCodeBench, einem Benchmark, der fortgeschrittene Programmierfähigkeiten testet. Darüber hinaus erzielte es 84,0 % im MMMU, das multimodale Verständnis und Logik evaluiert. Trotz dieser Errungenschaften bleibt Google vorsichtig. Hassabis erwähnte, dass das Team gründliche Sicherheitsprüfungen durchführt und Feedback von Experten einholt, bevor Deep Think breiter verfügbar gemacht wird. Derzeit ist es für vertrauenswürdige Tester über die API zugänglich, um Feedback einzusammeln. ### Gemini 2.5 Flash: Ein Arbeitpferd für den täglichen Gebrauch
Zusammen mit Gemini 2.5 Pro stellte Google auch eine verbesserte Version von Gemini 2.5 Flash vor, die für Geschwindigkeit, Effizienz und Wirtschaftlichkeit konzipiert wurde. Hassabis beschrieb es als das „Arbeitpferd“ der Serie, das in Benchmarks für Argumentation, Multimodalität, Code und lange Kontexte hervorragt. Tatsächlich rangiert es auf der LMArena-Leaderboard nur hinter Gemini 2.5 Pro. Das aktualisierte Flash-Modell ist etwa 20 bis 30 % effizienter und benötigt weniger Tokens, um Aufgaben auszuführen. Basierend auf Entwicklerfeedback optimierte Google das Modell und macht es für eine Vorschau in Google AI Studio, Vertex AI und der Gemini-App verfügbar. Es wird Mitte Juni für die Produktion vollständig bereitgestellt. ### Neue Funktionen in beiden Modellen
Sowohl Gemini 2.5 Pro als auch Flash erhielten mehrere neue Fähigkeiten, um die Benutzerinteraktion zu verbessern. Lokales Audiomaterial wurde hinzugefügt, um natürlichere Konversationserfahrungen zu ermöglichen, während die Text-zu-Sprechfunktion mehrere Stimmen unterstützt. Nutzer können sogar die Tonlage und den Stil der Sprache steuern, sei es melodramatisch oder ernsthaft. Andere experimentelle Sprachfunktionen umfassen affektives Dialogmanagement, das es der KI ermöglicht, Emotionen in der Stimme eines Benutzers zu erkennen und entsprechend zu reagieren, sowie proaktives Audio, das Hintergrundgeräusche filtert. Auch Thinking-Budgets wurden eingeführt, die Entwicklern Kontrolle über die Rechenleistung der KI geben, die vor der Antwort verwendet wird. ### Ein Schritt in die Zukunft
Diese Aktualisierungen unterstreichen Google’s Engagement, die Grenzen der KITechnologie zu erweitern. Wie Kavukcuoglu und Doshi in ihrem Blogpost bemerkten: „Wir erleben einen bemerkenswerten Moment in der Geschichte, wo AI eine fantastische neue Zukunft möglich macht. Es gab unaufhörliches Fortschreiten.“ Mit diesen Verbesserungen pflastert Google zweifellos den Weg zu einer Zukunft, in der KI-Assistenten unverzichtbare Begleiter in unserem Alltag werden.
Verwandter Artikel
딥 코그니토, 최고 순위 오픈소스 AI 모델 출시
딥 코지토, 혁명적인 AI 모델 출시샌프란시스코에 본사를 두고 있는 선도적인 AI 연구 스타트업 딥 코지토는 공식적으로 첫 번째 오픈 소스 대규모 언어 모델(Large Language Models, LLMs)인 '코지토 v1' 라인업을 발표했습니다. 이 모델들은 메타의 Llama 3.2에서 미세조정되었으며, 하이브리드 추
마이크로소프트, 빌드 2025에서 '自律형 웹'을 위한 50개 이상의 AI 도구 발표
마이크로소프트, 빌드 컨퍼런스에서 오픈 에이전틱 웹 비전 공개오늘 아침, 마이크로소프트는 연례 빌드 컨퍼런스를 시작하면서 대담한 선언을 내놓았다: "오픈 에이전틱 웹"의 탄생이다. 50개 이상의 발표를 통해 이 거대 기술사는 이 변혁적인 운동의 중심에 서겠다는 종합적인 전략을 밝혔다. GitHub, Azure부터 Wind
구글, 크롬에서 제미니 통합 론칭
Chrome에서 Gemini 통합 소개: AI 기반 브라우징의 새로운 시대2025년 구글 I/O에서 구글은 Chrome 브라우저에 획기적인 추가 기능을 발표하며 파장을 일으켰습니다. 바로 Gemini 통합입니다. 이 움직임은 사용자가 웹과 상호작용하는 방식에 큰 변화를 가져오며, 방문한 페이지에서 답변, 요약, 통찰을 쉽
Kommentare (0)
0/200
Google zieht sich seinem Ziel eines universellen KI-Assistenten nähender
In diesem Jahr wurde bei der Google I/O Veranstaltung bedeutende Aktualisierungen der Gemini 2.5-Serie vorgestellt, wobei insbesondere auf Verbesserungen in verschiedenen Dimensionen fokussiert wurde. Die neuesten Versionen – Gemini 2.5 Flash und 2.5 Pro – sind nun schlauer und effizienter als je zuvor. Diese Fortschritte bringen Google seinem Ziel näher, einen universellen KI-Assistenten zu entwickeln, der im Kontext verstehen, planen und Aufgaben nahtlos ausführen kann. ### Gemini 2.5 Pro: Intelligenz auf neuer Höhe
Gemini 2.5 Pro, das von Google als sein fortschrittlichstes Modell bislang bezeichnet wird, verfügt über einen bislang uneinandergesetzten Kontextfenster von einer Million Tokens. Diese Funktion ermöglicht es der KI, große Datenmengen zu verarbeiten und längere Gespräche kohärent zu führen. Bei der Veranstaltung äußerte Demis Hassabis, CEO von Google DeepMind, Begeisterung über die erreichten Fortschritte und sagte: „Dies ist unser ultimatives Ziel für die Gemini-App: Eine KI, die persönlich, proaktiv und leistungsstark ist.“ Eine herausragende Funktion von Gemini 2.5 Pro ist die Einführung des experimentellen erweiterten Denkmodus „Deep Think“. Deep Think ermöglicht es der KI, mehrere Hypothesen zu analysieren, bevor sie eine Antwort liefert, wodurch ihre Entscheidungsfindung verbessert wird. Gemäß Hassabis geht dieser Fortschritt aus Erkenntnissen während der Entwicklung von AlphaGo hervor, wo längere Verarbeitungszeiten bessere Ergebnisse brachten. #### Beeindruckende Leistungen in Benchmarks
Deep Think hat bereits herausragende Leistungen in anspruchsvollen Benchmarks gezeigt. So erreichte es beeindruckende Werte beim USAMO (2025 USA Mathematical Olympiad) und übertraf Erwartungen im LiveCodeBench, einem Benchmark, der fortgeschrittene Programmierfähigkeiten testet. Darüber hinaus erzielte es 84,0 % im MMMU, das multimodale Verständnis und Logik evaluiert. Trotz dieser Errungenschaften bleibt Google vorsichtig. Hassabis erwähnte, dass das Team gründliche Sicherheitsprüfungen durchführt und Feedback von Experten einholt, bevor Deep Think breiter verfügbar gemacht wird. Derzeit ist es für vertrauenswürdige Tester über die API zugänglich, um Feedback einzusammeln. ### Gemini 2.5 Flash: Ein Arbeitpferd für den täglichen Gebrauch
Zusammen mit Gemini 2.5 Pro stellte Google auch eine verbesserte Version von Gemini 2.5 Flash vor, die für Geschwindigkeit, Effizienz und Wirtschaftlichkeit konzipiert wurde. Hassabis beschrieb es als das „Arbeitpferd“ der Serie, das in Benchmarks für Argumentation, Multimodalität, Code und lange Kontexte hervorragt. Tatsächlich rangiert es auf der LMArena-Leaderboard nur hinter Gemini 2.5 Pro. Das aktualisierte Flash-Modell ist etwa 20 bis 30 % effizienter und benötigt weniger Tokens, um Aufgaben auszuführen. Basierend auf Entwicklerfeedback optimierte Google das Modell und macht es für eine Vorschau in Google AI Studio, Vertex AI und der Gemini-App verfügbar. Es wird Mitte Juni für die Produktion vollständig bereitgestellt. ### Neue Funktionen in beiden Modellen
Sowohl Gemini 2.5 Pro als auch Flash erhielten mehrere neue Fähigkeiten, um die Benutzerinteraktion zu verbessern. Lokales Audiomaterial wurde hinzugefügt, um natürlichere Konversationserfahrungen zu ermöglichen, während die Text-zu-Sprechfunktion mehrere Stimmen unterstützt. Nutzer können sogar die Tonlage und den Stil der Sprache steuern, sei es melodramatisch oder ernsthaft. Andere experimentelle Sprachfunktionen umfassen affektives Dialogmanagement, das es der KI ermöglicht, Emotionen in der Stimme eines Benutzers zu erkennen und entsprechend zu reagieren, sowie proaktives Audio, das Hintergrundgeräusche filtert. Auch Thinking-Budgets wurden eingeführt, die Entwicklern Kontrolle über die Rechenleistung der KI geben, die vor der Antwort verwendet wird. ### Ein Schritt in die Zukunft
Diese Aktualisierungen unterstreichen Google’s Engagement, die Grenzen der KITechnologie zu erweitern. Wie Kavukcuoglu und Doshi in ihrem Blogpost bemerkten: „Wir erleben einen bemerkenswerten Moment in der Geschichte, wo AI eine fantastische neue Zukunft möglich macht. Es gab unaufhörliches Fortschreiten.“ Mit diesen Verbesserungen pflastert Google zweifellos den Weg zu einer Zukunft, in der KI-Assistenten unverzichtbare Begleiter in unserem Alltag werden.












