Generalist stellt das universelle KI-Modell GEN-1 für physikalische Systeme vor

Zur Entwicklung von GEN-1 hat Generalist die Trainingsstabilität erhöht, maßgeschneiderte Kernel erstellt, neuartige Paged-Attention-Methoden für die Echtzeit-Inferenz entwickelt, Techniken für die Nachbearbeitung verfeinert und die Steuerung für einen flüssigeren und präziseren Betrieb verbessert. | Quelle: Generalist AI
Generalist AI Inc. stellte gestern sein universelles KI-Modell GEN-1 für die Robotik vor. Das Unternehmen gibt an, dass das System die durchschnittliche Erfolgsquote bei Aufgaben auf 99 % steigert – gegenüber 64 % bei früheren Modellen. Außerdem erledigt es Aufgaben etwa dreimal schneller als aktuelle Methoden und erzielt diese Ergebnisse laut Generalist mit nur einer Stunde Roboterdaten pro Aufgabe.
Das 2024 gegründete Unternehmen entwickelt verkörperte Grundmodelle für vielseitige Roboter. Generalist mit Sitz in San Mateo, Kalifornien, behauptet, GEN-1 „eröffne kommerzielle Machbarkeit für ein breites Spektrum an Anwendungen“. Diese Veröffentlichung folgt nur fünf Monate nach dem GEN-0-Modell, das laut Angaben des Unternehmens die Existenz von Skalierungsgesetzen in der Robotik bestätigte.
Obwohl Generalist hinsichtlich der Fortschritte des KI-Modells optimistisch ist, räumte das Unternehmen ein, dass GEN-1 nicht jede Aufgabe lösen kann. Das Start-up fügte hinzu, dass einige reale Anwendungen Erfolgsraten von über 99 % erfordern würden, um praktisch nutzbar zu sein.
Anmerkung der Redaktion: Auf dem „2026 Robotics Summit & Expo“ am 27. und 28. Mai in Boston werden Vorträge zur Entwicklung von verkörperter und physischer KI angeboten. Die Anmeldung ist ab sofort möglich.
GEN-1 wird mit realen Daten trainiert und baut auf GEN-0 auf
GEN-1 baut auf den Grundlagen von GEN-0 auf und nutzt weitere Skalierungen sowie algorithmische Verbesserungen, um grundlegende Aufgaben zu meistern, erklärte Generalist AI. Das Modell wurde von Grund auf mit dem Datensatz des Unternehmens trainiert, der eine halbe Million Stunden an Daten aus der realen Welt umfasst.
Mit GEN-0 demonstrierte Generalist, dass das Lernen von Robotern auf generalisierte Weise skaliert werden kann, ähnlich dem vorhersehbaren Fortschritt bei Sprachmodellen. Das Unternehmen stellte fest, dass jede von ihm überwachte Zero-Shot-Aufgabe eine gleichzeitige Verbesserung zeigte. Es räumte jedoch ein, dass die Leistung des Modells „für den kommerziellen Einsatz nicht ausreichte“.
GEN-1 ist das Ergebnis einer erhöhten Daten- und Rechenkapazität, beschleunigt durch algorithmische Durchbrüche, erklärte Generalist. Das Unternehmen berichtet, dass einige Aufgaben nun die Leistungsschwelle erreichen, die für einen wirtschaftlich tragfähigen Einsatz in der realen Welt erforderlich ist.
Das Unternehmen wies darauf hin, dass frühere allgemeine Robotikmodelle, die eine Erfolgsquote von über 90 % erreichten, auf massive, teure und schwer skalierbare Teleoperations-Datensätze angewiesen waren. Im Gegensatz dazu wird das Basismodell sowohl für GEN-0 als auch für GEN-1 ohne robotspezifische Daten trainiert.
Stattdessen nutzt das Modell Daten von kostengünstigen Wearables, die von Menschen getragen werden, die Millionen von Aktivitäten ausführen. Generalist gibt an, bewiesen zu haben, dass dieser Vortrainingsansatz zu hohen Beherrschungsgraden führen kann, ohne dass große Teleoperations- oder Simulationsdatensätze erforderlich sind.
Generalist nutzt Fortschritte in verschiedenen Technologien
Laut Generalist AI enthält GEN-1 Innovationen im Vortraining, die die Recheneffizienz verbessern. Fortschritte bei Techniken nach dem Training, beim Lernen aus Erfahrung (verstärkendes Lernen), bei der multimodalen menschlichen Anleitung und bei neuen Methoden zur Inferenzzeit trugen ebenfalls zu einer höheren Leistung bei jeder beliebigen Aufgabe bei.
Über diese Verbesserungen hinaus erklärte das Unternehmen, dass GEN-1 im Vergleich zu seinem Vorgänger eine erhebliche Steigerung des Rechenumfangs darstellt. „Es hat die Fähigkeit unter Beweis gestellt, neue Aufgaben schnell zu erlernen, sich an neue Umgebungen anzupassen und Momente physischen gesunden Menschenverstands zu zeigen“, so Generalist.
Das Unternehmen behauptet, GEN-1 sei ein dateneffizienter Lerner. In bestimmten Tests erzielte das Modell eine mit GEN-0 vergleichbare Leistung, wobei es zehnmal weniger aufgabenspezifische Daten und weniger Feinabstimmungsschritte benötigte.
Da der Vortrainingsdatensatz keine Roboterdaten enthält, lernt GEN-1, wenn es sich an eine neue Aufgabe anpasst, gleichzeitig sowohl die spezifische Roboterausführung als auch die Aufgabe selbst zum ersten Mal, erklärte Generalist.
GEN-1 verbessert Zuverlässigkeit und improvisatorische Intelligenz
„Verkörperte Grundmodelle müssen zuverlässig und schnell sein und in der Lage sein, sich von unerwarteten Situationen zu erholen“, so Generalist. In Bezug auf die Zuverlässigkeit erklärte das Unternehmen, dass GEN-1 mehrere Aufgaben über längere Zeiträume hinweg mit hoher Zuverlässigkeit und ohne menschliches Eingreifen ausführen kann.
Das Unternehmen demonstrierte GEN-1 anhand von sechs Aufgaben: über eine Stunde lang Autoteile zusammenstellen, T-Shirts 86 Mal hintereinander falten, Staubsaugerroboter mehr als 200 Mal hintereinander warten, Blöcke über 1.800 Mal hintereinander verpacken, Kartons über 200 Mal hintereinander falten und Telefone mehr als 100 Mal ohne Unterbrechung verpacken.
Aufgaben, die ohne Vortraining von Grund auf neu trainiert wurden, zeigten eine schlechte Leistung mit einer durchschnittlichen Erfolgsquote von 19 %. GEN-0-Modelle, die für diese Aufgaben feinabgestimmt wurden, erreichten eine Erfolgsquote von 64 %. Generalist gibt an, dass GEN-1 Erfolgsraten auf Produktionsniveau mit durchschnittlich 99 % erzielt.
Generalist erklärte, dass diese Modelle kreativ auf unvorhergesehene Szenarien reagieren können. Im Beispiel der Automobil-Kitting-Aufgabe könnte der Roboter, wenn eine Unterlegscheibe aus der richtigen Ausrichtung gerutscht wäre, diese ablegen, um sie erneut zu greifen, sie teilweise in einen Schlitz einführen, um extrinsische Geschicklichkeit zu zeigen, oder sogar seine andere Hand für ein beidhändiges Greifen in der Hand einsetzen.
Wenn große, verformbare Objekte wie T-Shirts in unerwarteten Konfigurationen landeten, könne das Modell herausfinden, wie es die Situation wieder in den Griff bekomme, so Generalist. „Diese Verhaltensweisen liegen weit außerhalb der Trainingsverteilung und tragen direkt dazu bei, seltene, unerwartete Ereignisse zu bewältigen“, merkte das Unternehmen an.
Generalist-Modell beschleunigt die Aufgabenerledigung
Generalist AI gab an, dass GEN-1 Aufgaben etwa dreimal schneller erledigt als der aktuelle Stand der Technik (SOTA) bei Demonstrationen. Das Modell kann dynamisch auf neue Objektphysik reagieren.
So kann GEN-1 beispielsweise eine Schachtel in 12,1 Sekunden zusammenbauen. Laut Generalist ist dies 2,8-mal schneller als der bisherige SOTA – sowohl GEN-0 als auch π0 benötigten bei identischen Schachteln etwa 34 Sekunden. GEN-1 kann zudem ein Smartphone in 15,5 Sekunden in eine Hülle stecken und arbeitet dabei 2,8-mal schneller als GEN-0.
Laut Generalist ermöglichten mehrere Komponenten diese Geschwindigkeitssteigerungen. Die Modelle lernen aus Erfahrungen und stellen durch „Harmonic Reasoning“ eine Weiterentwicklung der Inferenz dar.
Das Unternehmen würdigte zudem seine Datenerfassungsgeräte, die den Modellen Zugang zu einer riesigen Menge an Vortrainingsdaten aus der schnellen Ausführung verschiedener anderer Aufgaben ermöglichten und so Wissen aus allgemeinen Erfahrungen auf relevante Dynamiken übertrugen. Generalist stellte dies traditionellen Teleoperationssystemen gegenüber, die aufgrund fehlender Kraftrückmeldung, Latenz und Sichtbarkeitsproblemen naturgemäß langsamere, weniger flüssige Daten liefern.
„Die Entwicklung von GEN-1 war eine Herausforderung – wir haben unsere verteilte Trainingsinfrastruktur neu gestaltet, um Petabytes an physischen Interaktionsdaten nativ zu unterstützen“, so Generalist AI. Das Unternehmen gab bekannt, dass Early-Access-Partner nun Zugang zu dem Modell erhalten können.
Verwandter Artikel
MoveIt Pro 9.0 bietet Verbesserungen bei der Wahrnehmung und Fernsteuerung
Laut PickNik ermöglicht MoveIt Pro 9.0 Robotern, in Umgebungen mit wechselnder Geometrie und unterschiedlichen Oberflächen effizient zu arbeiten. | Quelle: PickNik RoboticsPickNik Inc. hat MoveIt Pro
SS Innovations entwickelt einen chirurgischen Roboter für die Lieferung per Drohne
Das SSi Vimana Aero Drone System soll verwundeten Soldaten auf dem Schlachtfeld direkt lebenswichtige medizinische Versorgung zukommen lassen. | Quelle: SS Innovations InternationalSS Innovations Inte
Das endgültige Design der Pebble Time 2 wurde vorgestellt
Mit der Rückkehr von Pebble zu seinen Wurzeln haben wir nun eine offizielle Vorschau auf die kommende Pebble Time 2, die noch in diesem Jahr an Kunden ausgeliefert werden soll. (Ein erster Einblick wu
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Zur Entwicklung von GEN-1 hat Generalist die Trainingsstabilität erhöht, maßgeschneiderte Kernel erstellt, neuartige Paged-Attention-Methoden für die Echtzeit-Inferenz entwickelt, Techniken für die Nachbearbeitung verfeinert und die Steuerung für einen flüssigeren und präziseren Betrieb verbessert. | Quelle: Generalist AI
Generalist AI Inc. stellte gestern sein universelles KI-Modell GEN-1 für die Robotik vor. Das Unternehmen gibt an, dass das System die durchschnittliche Erfolgsquote bei Aufgaben auf 99 % steigert – gegenüber 64 % bei früheren Modellen. Außerdem erledigt es Aufgaben etwa dreimal schneller als aktuelle Methoden und erzielt diese Ergebnisse laut Generalist mit nur einer Stunde Roboterdaten pro Aufgabe.
Das 2024 gegründete Unternehmen entwickelt verkörperte Grundmodelle für vielseitige Roboter. Generalist mit Sitz in San Mateo, Kalifornien, behauptet, GEN-1 „eröffne kommerzielle Machbarkeit für ein breites Spektrum an Anwendungen“. Diese Veröffentlichung folgt nur fünf Monate nach dem GEN-0-Modell, das laut Angaben des Unternehmens die Existenz von Skalierungsgesetzen in der Robotik bestätigte.
Obwohl Generalist hinsichtlich der Fortschritte des KI-Modells optimistisch ist, räumte das Unternehmen ein, dass GEN-1 nicht jede Aufgabe lösen kann. Das Start-up fügte hinzu, dass einige reale Anwendungen Erfolgsraten von über 99 % erfordern würden, um praktisch nutzbar zu sein.
Anmerkung der Redaktion: Auf dem „2026 Robotics Summit & Expo“ am 27. und 28. Mai in Boston werden Vorträge zur Entwicklung von verkörperter und physischer KI angeboten. Die Anmeldung ist ab sofort möglich.
GEN-1 wird mit realen Daten trainiert und baut auf GEN-0 auf
GEN-1 baut auf den Grundlagen von GEN-0 auf und nutzt weitere Skalierungen sowie algorithmische Verbesserungen, um grundlegende Aufgaben zu meistern, erklärte Generalist AI. Das Modell wurde von Grund auf mit dem Datensatz des Unternehmens trainiert, der eine halbe Million Stunden an Daten aus der realen Welt umfasst.
Mit GEN-0 demonstrierte Generalist, dass das Lernen von Robotern auf generalisierte Weise skaliert werden kann, ähnlich dem vorhersehbaren Fortschritt bei Sprachmodellen. Das Unternehmen stellte fest, dass jede von ihm überwachte Zero-Shot-Aufgabe eine gleichzeitige Verbesserung zeigte. Es räumte jedoch ein, dass die Leistung des Modells „für den kommerziellen Einsatz nicht ausreichte“.
GEN-1 ist das Ergebnis einer erhöhten Daten- und Rechenkapazität, beschleunigt durch algorithmische Durchbrüche, erklärte Generalist. Das Unternehmen berichtet, dass einige Aufgaben nun die Leistungsschwelle erreichen, die für einen wirtschaftlich tragfähigen Einsatz in der realen Welt erforderlich ist.
Das Unternehmen wies darauf hin, dass frühere allgemeine Robotikmodelle, die eine Erfolgsquote von über 90 % erreichten, auf massive, teure und schwer skalierbare Teleoperations-Datensätze angewiesen waren. Im Gegensatz dazu wird das Basismodell sowohl für GEN-0 als auch für GEN-1 ohne robotspezifische Daten trainiert.
Stattdessen nutzt das Modell Daten von kostengünstigen Wearables, die von Menschen getragen werden, die Millionen von Aktivitäten ausführen. Generalist gibt an, bewiesen zu haben, dass dieser Vortrainingsansatz zu hohen Beherrschungsgraden führen kann, ohne dass große Teleoperations- oder Simulationsdatensätze erforderlich sind.
Generalist nutzt Fortschritte in verschiedenen Technologien
Laut Generalist AI enthält GEN-1 Innovationen im Vortraining, die die Recheneffizienz verbessern. Fortschritte bei Techniken nach dem Training, beim Lernen aus Erfahrung (verstärkendes Lernen), bei der multimodalen menschlichen Anleitung und bei neuen Methoden zur Inferenzzeit trugen ebenfalls zu einer höheren Leistung bei jeder beliebigen Aufgabe bei.
Über diese Verbesserungen hinaus erklärte das Unternehmen, dass GEN-1 im Vergleich zu seinem Vorgänger eine erhebliche Steigerung des Rechenumfangs darstellt. „Es hat die Fähigkeit unter Beweis gestellt, neue Aufgaben schnell zu erlernen, sich an neue Umgebungen anzupassen und Momente physischen gesunden Menschenverstands zu zeigen“, so Generalist.
Das Unternehmen behauptet, GEN-1 sei ein dateneffizienter Lerner. In bestimmten Tests erzielte das Modell eine mit GEN-0 vergleichbare Leistung, wobei es zehnmal weniger aufgabenspezifische Daten und weniger Feinabstimmungsschritte benötigte.
Da der Vortrainingsdatensatz keine Roboterdaten enthält, lernt GEN-1, wenn es sich an eine neue Aufgabe anpasst, gleichzeitig sowohl die spezifische Roboterausführung als auch die Aufgabe selbst zum ersten Mal, erklärte Generalist.
GEN-1 verbessert Zuverlässigkeit und improvisatorische Intelligenz
„Verkörperte Grundmodelle müssen zuverlässig und schnell sein und in der Lage sein, sich von unerwarteten Situationen zu erholen“, so Generalist. In Bezug auf die Zuverlässigkeit erklärte das Unternehmen, dass GEN-1 mehrere Aufgaben über längere Zeiträume hinweg mit hoher Zuverlässigkeit und ohne menschliches Eingreifen ausführen kann.
Das Unternehmen demonstrierte GEN-1 anhand von sechs Aufgaben: über eine Stunde lang Autoteile zusammenstellen, T-Shirts 86 Mal hintereinander falten, Staubsaugerroboter mehr als 200 Mal hintereinander warten, Blöcke über 1.800 Mal hintereinander verpacken, Kartons über 200 Mal hintereinander falten und Telefone mehr als 100 Mal ohne Unterbrechung verpacken.
Aufgaben, die ohne Vortraining von Grund auf neu trainiert wurden, zeigten eine schlechte Leistung mit einer durchschnittlichen Erfolgsquote von 19 %. GEN-0-Modelle, die für diese Aufgaben feinabgestimmt wurden, erreichten eine Erfolgsquote von 64 %. Generalist gibt an, dass GEN-1 Erfolgsraten auf Produktionsniveau mit durchschnittlich 99 % erzielt.
Generalist erklärte, dass diese Modelle kreativ auf unvorhergesehene Szenarien reagieren können. Im Beispiel der Automobil-Kitting-Aufgabe könnte der Roboter, wenn eine Unterlegscheibe aus der richtigen Ausrichtung gerutscht wäre, diese ablegen, um sie erneut zu greifen, sie teilweise in einen Schlitz einführen, um extrinsische Geschicklichkeit zu zeigen, oder sogar seine andere Hand für ein beidhändiges Greifen in der Hand einsetzen.
Wenn große, verformbare Objekte wie T-Shirts in unerwarteten Konfigurationen landeten, könne das Modell herausfinden, wie es die Situation wieder in den Griff bekomme, so Generalist. „Diese Verhaltensweisen liegen weit außerhalb der Trainingsverteilung und tragen direkt dazu bei, seltene, unerwartete Ereignisse zu bewältigen“, merkte das Unternehmen an.
Generalist-Modell beschleunigt die Aufgabenerledigung
Generalist AI gab an, dass GEN-1 Aufgaben etwa dreimal schneller erledigt als der aktuelle Stand der Technik (SOTA) bei Demonstrationen. Das Modell kann dynamisch auf neue Objektphysik reagieren.
So kann GEN-1 beispielsweise eine Schachtel in 12,1 Sekunden zusammenbauen. Laut Generalist ist dies 2,8-mal schneller als der bisherige SOTA – sowohl GEN-0 als auch π0 benötigten bei identischen Schachteln etwa 34 Sekunden. GEN-1 kann zudem ein Smartphone in 15,5 Sekunden in eine Hülle stecken und arbeitet dabei 2,8-mal schneller als GEN-0.
Laut Generalist ermöglichten mehrere Komponenten diese Geschwindigkeitssteigerungen. Die Modelle lernen aus Erfahrungen und stellen durch „Harmonic Reasoning“ eine Weiterentwicklung der Inferenz dar.
Das Unternehmen würdigte zudem seine Datenerfassungsgeräte, die den Modellen Zugang zu einer riesigen Menge an Vortrainingsdaten aus der schnellen Ausführung verschiedener anderer Aufgaben ermöglichten und so Wissen aus allgemeinen Erfahrungen auf relevante Dynamiken übertrugen. Generalist stellte dies traditionellen Teleoperationssystemen gegenüber, die aufgrund fehlender Kraftrückmeldung, Latenz und Sichtbarkeitsproblemen naturgemäß langsamere, weniger flüssige Daten liefern.
„Die Entwicklung von GEN-1 war eine Herausforderung – wir haben unsere verteilte Trainingsinfrastruktur neu gestaltet, um Petabytes an physischen Interaktionsdaten nativ zu unterstützen“, so Generalist AI. Das Unternehmen gab bekannt, dass Early-Access-Partner nun Zugang zu dem Modell erhalten können.
SS Innovations entwickelt einen chirurgischen Roboter für die Lieferung per Drohne
Das SSi Vimana Aero Drone System soll verwundeten Soldaten auf dem Schlachtfeld direkt lebenswichtige medizinische Versorgung zukommen lassen. | Quelle: SS Innovations InternationalSS Innovations Inte
Das endgültige Design der Pebble Time 2 wurde vorgestellt
Mit der Rückkehr von Pebble zu seinen Wurzeln haben wir nun eine offizielle Vorschau auf die kommende Pebble Time 2, die noch in diesem Jahr an Kunden ausgeliefert werden soll. (Ein erster Einblick wu





Heim






