DeepMinds neue KI ermöglicht es Robotern, Aufgaben über die Websuche zu erledigen
Google DeepMind hat angekündigt, dass seine verbesserten KI-Modelle Roboter nun in die Lage versetzen, kompliziertere Aufgaben zu bewältigen und sogar Webressourcen zur Unterstützung zu nutzen. Während einer Pressekonferenz erklärte Carolina Parada, Leiterin der Robotikabteilung von Google DeepMind, dass die neuesten KI-Modelle des Unternehmens zusammenarbeiten, um Roboter in die Lage zu versetzen, "mehrere Schritte im Voraus zu planen", bevor sie Aktionen in der physischen Umgebung ausführen.
Das System wird von dem kürzlich veröffentlichten Gemini Robotics 1.5 und dem Embodied Reasoning-Modell Gemini Robotics-ER 1.5 angetrieben, bei denen es sich um aktualisierte Versionen der KI-Modelle handelt, die Google DeepMind im März vorgestellt hat. Roboter sind nicht mehr darauf beschränkt, einzelne Aufgaben wie das Falten eines Blattes Papier oder das Öffnen einer Tasche auszuführen. Sie können nun Tätigkeiten wie das Sortieren von Wäsche nach dunklen und hellen Farben, das Packen eines Koffers entsprechend dem aktuellen Wetter in London und die Unterstützung bei der Müll-, Kompost- und Recyclingtrennung auf der Grundlage ortsspezifischer Richtlinien, die aus Websuchen abgerufen werden, übernehmen.
"Die Vorgängermodelle zeichneten sich durch eine hohe Vielseitigkeit bei der Ausführung einzelner Anweisungen aus", so Parada. "Mit diesem Update gehen wir von Einzelschrittanweisungen zu echtem Verständnis und Problemlösung für physische Aufgaben über."
Um dies zu erreichen, verwenden die Roboter das aktualisierte Modell Gemini Robotics-ER 1.5, um ihre Umgebung zu interpretieren und digitale Tools wie Google Search für zusätzliche Informationen zu nutzen. Gemini Robotics-ER 1.5 wandelt diese Erkenntnisse dann in einfachsprachige Anweisungen für Gemini Robotics 1.5 um, so dass der Roboter die visuellen und sprachlichen Fähigkeiten des Modells nutzen kann, um jeden Schritt auszuführen.

Die KI-Modelle von Google DeepMind arbeiten zusammen, um Robotern bei der Planung und Ausführung von Aufgaben zu helfen. Bild: GoogleSiehe
- Das optimierte KI-Modell von Google DeepMind arbeitet direkt mit Robotern zusammen
Darüber hinaus hat Google DeepMind bekannt gegeben, dass Gemini Robotics 1.5 es Robotern ermöglicht, unabhängig von ihrer Hardwarekonfiguration voneinander zu lernen". Das Unternehmen stellte fest, dass Aufgaben, die auf dem ALOHA2-Roboter - einem System mit zwei mechanischen Armen - demonstriert wurden, direkt auf dem zweiarmigen Roboter Franka und dem humanoiden Roboter Apollo von Apptronik ausgeführt werden können. "Dies bietet zwei entscheidende Vorteile: Erstens können wir sehr unterschiedliche Roboter, einschließlich Humanoiden, mit einem einzigen Modell steuern", erklärte Google DeepMind Software-Ingenieur Kanishka Rao während des Briefings. "Zweitens können die von einem Roboter erworbenen Fähigkeiten nun auf einen anderen übertragen werden."
Als Teil dieser Einführung macht Google DeepMind Gemini Robotics-ER 1.5 für Entwickler über die Gemini-API in Google AI Studio verfügbar, während Gemini Robotics 1.5 nur für ausgewählte Partner zugänglich bleibt.
Verwandter Artikel
Kakao Mobility stellt einen Fahrplan für autonomes Fahren der Stufe 4 im Bereich der physischen KI vor
Kakao Mobility plant, im Rahmen seiner Strategie für physische KI Technologien für autonomes Fahren der Stufe 4 intern zu entwickeln.Auf der Konferenz „World IT Show 2026“ im COEX in Seoul stellte Ki
Google führt Gemini in Chrome in Indien ein
Am Mittwoch gab Google bekannt, dass es die Integration von Gemini in Chrome auf neue Regionen ausweitet, darunter Indien, Kanada und Neuseeland. Durch diese Einführung können Desktop-Nutzer über eine
Barry Diller: Das Vertrauen in Sam Altman spielt keine Rolle, da die allgemeine künstliche Intelligenz (AGI) immer näher rückt
Barry Diller, der milliardenschwere Medienmogul, hält OpenAI-CEO Sam Altman nicht für unglaubwürdig, obwohl jüngste Berichte das Gegenteil nahelegen. Bei seiner Rede auf der „Future of Everything“-Kon
Empfehlungen zu verwandten Spezialthemen
Kommentare (1)
Google DeepMind hat angekündigt, dass seine verbesserten KI-Modelle Roboter nun in die Lage versetzen, kompliziertere Aufgaben zu bewältigen und sogar Webressourcen zur Unterstützung zu nutzen. Während einer Pressekonferenz erklärte Carolina Parada, Leiterin der Robotikabteilung von Google DeepMind, dass die neuesten KI-Modelle des Unternehmens zusammenarbeiten, um Roboter in die Lage zu versetzen, "mehrere Schritte im Voraus zu planen", bevor sie Aktionen in der physischen Umgebung ausführen.
Das System wird von dem kürzlich veröffentlichten Gemini Robotics 1.5 und dem Embodied Reasoning-Modell Gemini Robotics-ER 1.5 angetrieben, bei denen es sich um aktualisierte Versionen der KI-Modelle handelt, die Google DeepMind im März vorgestellt hat. Roboter sind nicht mehr darauf beschränkt, einzelne Aufgaben wie das Falten eines Blattes Papier oder das Öffnen einer Tasche auszuführen. Sie können nun Tätigkeiten wie das Sortieren von Wäsche nach dunklen und hellen Farben, das Packen eines Koffers entsprechend dem aktuellen Wetter in London und die Unterstützung bei der Müll-, Kompost- und Recyclingtrennung auf der Grundlage ortsspezifischer Richtlinien, die aus Websuchen abgerufen werden, übernehmen.
"Die Vorgängermodelle zeichneten sich durch eine hohe Vielseitigkeit bei der Ausführung einzelner Anweisungen aus", so Parada. "Mit diesem Update gehen wir von Einzelschrittanweisungen zu echtem Verständnis und Problemlösung für physische Aufgaben über."
Um dies zu erreichen, verwenden die Roboter das aktualisierte Modell Gemini Robotics-ER 1.5, um ihre Umgebung zu interpretieren und digitale Tools wie Google Search für zusätzliche Informationen zu nutzen. Gemini Robotics-ER 1.5 wandelt diese Erkenntnisse dann in einfachsprachige Anweisungen für Gemini Robotics 1.5 um, so dass der Roboter die visuellen und sprachlichen Fähigkeiten des Modells nutzen kann, um jeden Schritt auszuführen.

Siehe
- Das optimierte KI-Modell von Google DeepMind arbeitet direkt mit Robotern zusammen
Darüber hinaus hat Google DeepMind bekannt gegeben, dass Gemini Robotics 1.5 es Robotern ermöglicht, unabhängig von ihrer Hardwarekonfiguration voneinander zu lernen". Das Unternehmen stellte fest, dass Aufgaben, die auf dem ALOHA2-Roboter - einem System mit zwei mechanischen Armen - demonstriert wurden, direkt auf dem zweiarmigen Roboter Franka und dem humanoiden Roboter Apollo von Apptronik ausgeführt werden können. "Dies bietet zwei entscheidende Vorteile: Erstens können wir sehr unterschiedliche Roboter, einschließlich Humanoiden, mit einem einzigen Modell steuern", erklärte Google DeepMind Software-Ingenieur Kanishka Rao während des Briefings. "Zweitens können die von einem Roboter erworbenen Fähigkeiten nun auf einen anderen übertragen werden."
Als Teil dieser Einführung macht Google DeepMind Gemini Robotics-ER 1.5 für Entwickler über die Gemini-API in Google AI Studio verfügbar, während Gemini Robotics 1.5 nur für ausgewählte Partner zugänglich bleibt.
Google führt Gemini in Chrome in Indien ein
Am Mittwoch gab Google bekannt, dass es die Integration von Gemini in Chrome auf neue Regionen ausweitet, darunter Indien, Kanada und Neuseeland. Durch diese Einführung können Desktop-Nutzer über eine
Barry Diller: Das Vertrauen in Sam Altman spielt keine Rolle, da die allgemeine künstliche Intelligenz (AGI) immer näher rückt
Barry Diller, der milliardenschwere Medienmogul, hält OpenAI-CEO Sam Altman nicht für unglaubwürdig, obwohl jüngste Berichte das Gegenteil nahelegen. Bei seiner Rede auf der „Future of Everything“-Kon





Heim






