Дом
MotuBrain от Shengshu Technology устанавливает стандарт «воплощенного интеллекта», а этот международный «темная лошадка» возглавляет два рейтинга
«Загадочная модель», которая в течение трех недель была предметом обсуждений в сфере воплощенного интеллекта, наконец-то была идентифицирована. Несколько недель назад модель под названием MotuBrain незаметно поднялась на вершину рейтингов двух крупнейших международных тестов по пониманию физического мира и выполнению действий, вызвав широкий интерес в отрасли. Недавно компания Shengshu Technology , известная своей моделью генерации видео Vidu, официально подтвердила, что эта модель является её новейшим коммерческим продуктом в сфере воплощенного интеллекта.
Этот междисциплинарный шаг — далеко не случайный эксперимент. MotuBrain установила новые рекорды в WorldArena (тестирование понимания физического мира) и RoboTwin 2.0 (оценка выполнения действий). В частности, в сложных средах с имитированными случайными помехами она стала единственной моделью, достигшей среднего балла выше 95, продемонстрировав сильные способности к обобщению.

«Видеть и действовать»: устранение барьеров между восприятием и действием
В отличие от традиционных моделей «сначала представить, потом действовать», MotuBrain использует инновационную структуру «World Action Model». Такой подход «видеть и действовать» позволяет роботам моделировать ситуацию во время принятия решений, предотвращая наложение друг на друга ошибок прогнозирования и выполнения, а также значительно повышая скорость реакции.
В ходе практических демонстраций роботы, оснащенные этой системой, продемонстрировали высокий уровень интеллекта. В сценарии с горячим супом робот мог визуально определить, пуста ли ложка, и самостоятельно решить, следует ли снова взять ее, вместо того чтобы механически повторять заранее заданные действия. Эта способность «читать сцену» знаменует переход роботов от простого механического выполнения действий к подлинному интеллектуальному принятию решений.

Один мозг, множество форм: бесперебойное выполнение задач с длительным горизонтом
Основная сила MotuBrain заключается в его высокой универсальности. Он поддерживает подход «один мозг, множество форм», адаптируясь к корпусам роботов с различной степенью свободы и конфигурациями датчиков, а также справляясь с задачами с длительным горизонтом. В демонстрациях, таких как составление букетов, приготовление коктейлей и приведение в порядок дивана, робот может последовательно выполнять более десяти атомарных действий, причем процесс проходит плавно и не требует вмешательства человека.
Данные показывают, что по мере увеличения разнообразия задач успешность обучения MotuBrain имеет тенденцию к улучшению. Это указывает на то, что модель уловила универсальные законы физического мира, а не просто запомнила шаблоны действий. Чем разнообразнее задачи, тем лучше ее производительность.
Установление присутствия в физическом мире, развитие по двум направлениям в цифровой и физической сферах
Сила, продемонстрированная Shengshu Technology , проистекает из ее глубокой технической базы. Благодаря первой в мире архитектуре U-ViT компания объединила генерацию цифрового мира (VGM) и выполнение действий в физическом мире (WAM). С одной стороны, Vidu генерирует виртуальные миры, а с другой — MotuBrain управляет физическими взаимодействиями. Эта стратегия «двух направлений» дает компании значительное преимущество в затратах на сбор данных и скорости итерации моделей.
В настоящее время Shengshu Technology установила стратегическое партнерство с несколькими компаниями, включая WuJie Dynamics и XingChen Intelligence. По мере того как конкуренция в сфере воплощенного интеллекта смещает фокус, разработчики моделей с универсальным «мозгом» становятся ключевыми силами, перестраивающими ландшафт отрасли.
Связанная статья
Доходы компании Anthropropic растут стремительно; ее рыночная капитализация приближается к отметке в триллион долларов.
Отчеты показывают, что компания Anthropic добилась значительного роста доходов всего за несколько месяцев. Годовой объем ее доходов теперь превышает 30 миллиардов долларов — это более чем в три раза больше, чем было в конце прошлого года. Такой рост
Компания Apple удалила приложение Cal AI из-за несанкционированных покупок внутри приложения и манипулятивных способов осуществления платежей.
Недавнее удаление Apple приложения Cal AI, популярного приложения для отслеживания потребления пищи на основе искусственного интеллекта в рамках сервиса MyFitnessPal, подчеркивает строгое соблюдение Apple политик App Store в отношении внешних платеже
Тарификация Github Copilot на основе токенов вызывает возмущение среди разработчиков
Золотой век сервиса GitHub Copilot от Microsoft, по-видимому, подходит к концу, особенно для частных пользователей. Компания переходит от фиксированной абонентской платы к модели оплаты на основе токенов, что может значительно увеличить затраты. Боль
Рекомендации по связанным специальным темам
Комментарии (0)
«Загадочная модель», которая в течение трех недель была предметом обсуждений в сфере воплощенного интеллекта, наконец-то была идентифицирована. Несколько недель назад модель под
Этот междисциплинарный шаг — далеко не случайный эксперимент. MotuBrain установила новые рекорды в WorldArena (тестирование понимания физического мира) и RoboTwin 2.0 (оценка выполнения действий). В частности, в сложных средах с имитированными случайными помехами она стала единственной моделью, достигшей среднего балла выше 95, продемонстрировав сильные способности к обобщению.

«Видеть и действовать»: устранение барьеров между восприятием и действием
В отличие от традиционных моделей «сначала представить, потом действовать»,
В ходе практических демонстраций роботы, оснащенные этой системой, продемонстрировали высокий уровень интеллекта. В сценарии с горячим супом робот мог визуально определить, пуста ли ложка, и самостоятельно решить, следует ли снова взять ее, вместо того чтобы механически повторять заранее заданные действия. Эта способность «читать сцену» знаменует переход роботов от простого механического выполнения действий к подлинному интеллектуальному принятию решений.

Один мозг, множество форм: бесперебойное выполнение задач с длительным горизонтом
Основная сила
Данные показывают, что по мере увеличения разнообразия задач успешность обучения
Установление присутствия в физическом мире, развитие по двум направлениям в цифровой и физической сферах
Сила, продемонстрированная
В настоящее время Shengshu Technology установила стратегическое партнерство с несколькими компаниями, включая WuJie Dynamics и XingChen Intelligence. По мере того как конкуренция в сфере воплощенного интеллекта смещает фокус, разработчики моделей с универсальным «мозгом» становятся ключевыми силами, перестраивающими ландшафт отрасли.
Доходы компании Anthropropic растут стремительно; ее рыночная капитализация приближается к отметке в триллион долларов.
Отчеты показывают, что компания Anthropic добилась значительного роста доходов всего за несколько месяцев. Годовой объем ее доходов теперь превышает 30 миллиардов долларов — это более чем в три раза больше, чем было в конце прошлого года. Такой рост
Компания Apple удалила приложение Cal AI из-за несанкционированных покупок внутри приложения и манипулятивных способов осуществления платежей.
Недавнее удаление Apple приложения Cal AI, популярного приложения для отслеживания потребления пищи на основе искусственного интеллекта в рамках сервиса MyFitnessPal, подчеркивает строгое соблюдение Apple политик App Store в отношении внешних платеже
Тарификация Github Copilot на основе токенов вызывает возмущение среди разработчиков
Золотой век сервиса GitHub Copilot от Microsoft, по-видимому, подходит к концу, особенно для частных пользователей. Компания переходит от фиксированной абонентской платы к модели оплаты на основе токенов, что может значительно увеличить затраты. Боль











