Heim
MotuBrain von Shengshu Technology setzt neue Maßstäbe für verkörperte Intelligenz – der Außenseiter führt zwei Ranglisten an
Das „mysteriöse Modell“, das seit drei Wochen im Bereich der verkörperten Intelligenz für Aufsehen sorgt, wurde nun endlich identifiziert. Vor einigen Wochen stieg ein Modell namens MotuBrain still und leise an die Spitze zweier bedeutender internationaler Benchmarks für das Verständnis der physischen Welt und die Ausführung von Handlungen auf und weckte damit in der Branche große Neugier. Vor kurzem bestätigte Shengshu Technology , bekannt für sein Videogenerierungsmodell Vidu, offiziell, dass es sich bei diesem Modell um sein neuestes kommerzielles Produkt im Bereich der verkörperten Intelligenz handelt.
Dieser domänenübergreifende Schritt ist keineswegs ein zufälliges Experiment. MotuBrain stellte neue Rekorde bei WorldArena (Test des Verständnisses der physischen Welt) und RoboTwin 2.0 (Bewertung der Handlungsausführung) auf. Insbesondere in komplexen Umgebungen mit simulierten zufälligen Störungen war es das einzige Modell, das eine Durchschnittspunktzahl von über 95 erreichte, was seine starken Generalisierungsfähigkeiten unter Beweis stellte.

„Sehen und Handeln“: Barrieren zwischen Wahrnehmung und Aktion überwinden
Im Gegensatz zu traditionellen „Erst vorstellen, dann handeln“-Modellen nutzt MotuBrain ein innovatives „World Action Model“-Framework. Dieses „Sehen und Handeln“-Design ermöglicht es Robotern, während der Entscheidungsfindung zu simulieren, wodurch verhindert wird, dass sich Vorhersage- und Ausführungsfehler gegenseitig verstärken, und die Reaktionsgeschwindigkeit deutlich verbessert wird.
In praktischen Demonstrationen zeigten Roboter, die mit diesem System ausgestattet waren, ein hohes Maß an Intelligenz. In einem Hot-Pot-Szenario konnte der Roboter visuell feststellen, ob der Löffel leer war, und autonom entscheiden, ob er ihn erneut holen sollte, anstatt vordefinierte Aktionen starr zu wiederholen. Diese Fähigkeit, „die Szene zu lesen“, markiert den Übergang von Robotern von der einfachen mechanischen Ausführung hin zu echter intelligenter Entscheidungsfindung.

Ein Gehirn, viele Formen: Nahtlose Ausführung von Aufgaben mit langfristigem Horizont
Die Kernstärke von MotuBrain liegt in seiner großen Vielseitigkeit. Es unterstützt einen „One Brain, Multiple Forms“-Ansatz, passt sich an Roboterkörper mit unterschiedlichen Freiheitsgraden und Sensorkonfigurationen an und bewältigt gleichzeitig Aufgaben mit langem Zeithorizont. In Demonstrationen wie Blumenarrangieren, Cocktailmixen und Sofaaufräumen kann der Roboter über zehn einzelne Aktionen nacheinander ausführen, wobei der Ablauf reibungslos verläuft und kein menschliches Eingreifen erfordert.
Daten zeigen, dass sich die Lernerfolgsrate von MotuBrain tendenziell verbessert, je vielfältiger die Aufgaben werden. Dies deutet darauf hin, dass das Modell die universellen Grundgesetze der physikalischen Welt erfasst hat, anstatt sich lediglich Aktionsvorlagen einzuprägen. Je vielfältiger die Aufgaben, desto besser seine Leistung.
Etablierung einer Präsenz in der physischen Welt, Verfolgung eines zweigleisigen Ansatzes im digitalen und physischen Bereich
Die Stärke von Shengshu Technology beruht auf seiner soliden technischen Grundlage. Durch die weltweit einzigartige U-ViT-Architektur hat das Unternehmen die Generierung der digitalen Welt (VGM) und die Ausführung in der physischen Welt (WAM) vereint. Einerseits generiert Vidu virtuelle Welten, andererseits steuert MotuBrain physische Interaktionen. Diese zweigleisige Strategie verschafft dem Unternehmen einen erheblichen Vorteil bei den Kosten für die Datenerfassung und der Geschwindigkeit der Modelliteration.
Derzeit hat Shengshu Technology strategische Partnerschaften mit mehreren Unternehmen geschlossen, darunter WuJie Dynamics und XingChen Intelligence. Da sich der Fokus im Wettbewerb um verkörperte Intelligenz verlagert, werden Modellentwickler mit einem universellen „Gehirn“ zu treibenden Kräften, die die Branchenlandschaft neu gestalten.
Verwandter Artikel
Anthropogenic Einnahmen steigen rasant, Marktkapital nähert sich der Marke von einer Billion Dollar
Berichte deuten darauf hin, dass Anthropic in nur wenigen Monaten einen erheblichen Umsatzzuwachs verzeichnet hat. Der jährlich berechnete Umsatz des Unternehmens übersteigt nun 30 Milliarden US-Dollar – das ist mehr als das Dreifache des Wertes Ende
Apple entfernt die Cal AI-App aufgrund nicht autorisierter In-App-Käufe und manipulativer Abrechnungspraktiken.
Apples jüngste Entfernung von Cal AI, einer beliebten KI-basierten Ernährungsüberwachungsapp innerhalb von MyFitnessPal, unterstreicht die strenge Einhaltung der App Store-Richtlinien bezüglich externer Zahlungen und Abonnements. Die App, die jährlic
Die tokenbasierte Abrechnungsmethode von Github Copilot löst Empörung bei Entwicklern aus
Die goldene Ära von Microsofts GitHub Copilot könnte zu Ende gehen – insbesondere für einzelne Nutzer. Das Unternehmen wechselt von einer festen Abonnementgebühr zu einem tokenbasierten Abrechnungsmodell, was die Kosten erheblich erhöhen könnte. Währ
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Das „mysteriöse Modell“, das seit drei Wochen im Bereich der verkörperten Intelligenz für Aufsehen sorgt, wurde nun endlich identifiziert. Vor einigen Wochen stieg ein Modell namens
Dieser domänenübergreifende Schritt ist keineswegs ein zufälliges Experiment. MotuBrain stellte neue Rekorde bei WorldArena (Test des Verständnisses der physischen Welt) und RoboTwin 2.0 (Bewertung der Handlungsausführung) auf. Insbesondere in komplexen Umgebungen mit simulierten zufälligen Störungen war es das einzige Modell, das eine Durchschnittspunktzahl von über 95 erreichte, was seine starken Generalisierungsfähigkeiten unter Beweis stellte.

„Sehen und Handeln“: Barrieren zwischen Wahrnehmung und Aktion überwinden
Im Gegensatz zu traditionellen „Erst vorstellen, dann handeln“-Modellen nutzt
In praktischen Demonstrationen zeigten Roboter, die mit diesem System ausgestattet waren, ein hohes Maß an Intelligenz. In einem Hot-Pot-Szenario konnte der Roboter visuell feststellen, ob der Löffel leer war, und autonom entscheiden, ob er ihn erneut holen sollte, anstatt vordefinierte Aktionen starr zu wiederholen. Diese Fähigkeit, „die Szene zu lesen“, markiert den Übergang von Robotern von der einfachen mechanischen Ausführung hin zu echter intelligenter Entscheidungsfindung.

Ein Gehirn, viele Formen: Nahtlose Ausführung von Aufgaben mit langfristigem Horizont
Die Kernstärke von
Daten zeigen, dass sich die Lernerfolgsrate von
Etablierung einer Präsenz in der physischen Welt, Verfolgung eines zweigleisigen Ansatzes im digitalen und physischen Bereich
Die Stärke von
Derzeit hat Shengshu Technology strategische Partnerschaften mit mehreren Unternehmen geschlossen, darunter WuJie Dynamics und XingChen Intelligence. Da sich der Fokus im Wettbewerb um verkörperte Intelligenz verlagert, werden Modellentwickler mit einem universellen „Gehirn“ zu treibenden Kräften, die die Branchenlandschaft neu gestalten.
Anthropogenic Einnahmen steigen rasant, Marktkapital nähert sich der Marke von einer Billion Dollar
Berichte deuten darauf hin, dass Anthropic in nur wenigen Monaten einen erheblichen Umsatzzuwachs verzeichnet hat. Der jährlich berechnete Umsatz des Unternehmens übersteigt nun 30 Milliarden US-Dollar – das ist mehr als das Dreifache des Wertes Ende
Apple entfernt die Cal AI-App aufgrund nicht autorisierter In-App-Käufe und manipulativer Abrechnungspraktiken.
Apples jüngste Entfernung von Cal AI, einer beliebten KI-basierten Ernährungsüberwachungsapp innerhalb von MyFitnessPal, unterstreicht die strenge Einhaltung der App Store-Richtlinien bezüglich externer Zahlungen und Abonnements. Die App, die jährlic
Die tokenbasierte Abrechnungsmethode von Github Copilot löst Empörung bei Entwicklern aus
Die goldene Ära von Microsofts GitHub Copilot könnte zu Ende gehen – insbesondere für einzelne Nutzer. Das Unternehmen wechselt von einer festen Abonnementgebühr zu einem tokenbasierten Abrechnungsmodell, was die Kosten erheblich erhöhen könnte. Währ











