Дом
Ant Forest LingBot представляет набор данных с открытым исходным кодом объемом 2,7 ТБ, содержащий 2 млн реальных образцов, снятых с помощью 6 камер
31 марта компания Ant Lingbo Technology официально открыла доступ к крупномасштабному набору данных RGB-D под названием LingBot-Depth-Dataset. Этот набор содержит 3 миллиона пар высококачественных образцов, из которых 2 миллиона были сняты в реальных условиях, а 1 миллион — синтезированы. Общий объем набора составляет 2,71 ТБ, он включает данные с шести популярных камер глубины, что делает его крупнейшим набором данных RGB-D с открытым исходным кодом, основанным преимущественно на реальных сценах. Этот релиз предоставляет более богатые и реалистичные данные для продвижения исследований в области воплощенного интеллекта, пространственного восприятия и 3D-зрения.

(Изображение: образец из LingBot-Depth-Dataset. Сверху вниз: RGB-изображение, необработанная карта глубины датчика и эталонная карта глубины. Набор данных предоставляет как необработанную, так и эталонную информацию о глубине, обеспечивая надежную поддержку для обучения и оценки моделей в реальных условиях.)
Общедоступные наборы данных о глубине давно сталкиваются с проблемами ограниченного масштаба, недостаточного охвата реальных сцен и зависимости от отдельных типов оборудования. Многие наборы данных в основном являются синтетическими и демонстрируют значительные пробелы по сравнению с реальными данными датчиков с точки зрения моделей шума, провалов глубины и представления материалов, что препятствует практическому внедрению обученных моделей.
Набор данных LingBot-Depth-Dataset эффективно устраняет этот пробел в данных о пространственном восприятии, предоставляя крупномасштабные снимки реальных сцен. Каждый образец включает в себя RGB-изображение, необработанную карту глубины с датчика и соответствующую карту глубины «ground truth», что делает его непосредственно применимым для обучения и оценки моделей оценки глубины и восстановления глубины. Он поддерживает шесть популярных камер глубины — Orbbec 335, 335L, а также Intel RealSense D405, D415, D435, D455 — что способствует лучшей обобщаемости и оценке моделей на различных устройствах и в различных сценариях.
Ранее открытая высокоточная модель пространственного восприятия Ан Линбо, LingBot-Depth, была обучена с использованием этого набора данных в качестве основных данных. По сравнению с основными отраслевыми методами, такими как PromptDA и PriorDA, LingBot-Depth снижает погрешность прогнозирования глубины более чем на 70% в помещениях и примерно на 47% при задачах восстановления разреженной глубины. При внедрении эта модель позволяет коммерческим камерам глубины создавать более полные, плавные и четкие карты глубины в сложных условиях, таких как прозрачное стекло, отражающие поверхности и задний свет — и все это без модификации оборудования. В определенных сценариях ее производительность сопоставима с производительностью высококачественных камер глубины промышленного уровня.
Для академических и исследовательских учреждений эта инициатива с открытым исходным кодом снижает барьеры для сбора и аннотирования данных, ускоряя переход технологий пространственного восприятия от исследований к реальному применению. По мере того как робототехника и встроенный интеллект быстро интегрируются в физическую среду, крупномасштабные высококачественные наборы данных, основанные на реальных данных, станут важнейшей инфраструктурой для обеспечения непрерывного прогресса в отрасли.
Связанная статья
ElevenLabs объявила о привлечении в качестве новых инвесторов компаний BlackRock, Джейми Фокса и Евы Лонгории
Компания ElevenLabs, занимающаяся разработкой голосовых ИИ-технологий, раскрыла имена дополнительных инвесторов, участвовавших в раунде финансирования серии D на сумму 500 млн долларов, о котором перв
Генеральный директор OpenAI Альтман раскритиковал Anthropic за маркетинговые приемы, продиктованные паникой
Продолжающийся публичный спор между лидерами в области искусственного интеллекта — компаниями OpenAI и Anthropic — обострился. Сэм Альтман, генеральный директор OpenAI, недавно в ходе подкаста подверг
Стартап Cursor AI, занимающийся разработкой программного обеспечения, планирует нанять 200 сотрудников в Азиатско-Тихоокеанском регионе после получения значительных инвестиций от SpaceX
Стартап Cursor, занимающийся разработкой решений в области искусственного интеллекта, объявил о масштабной глобальной экспансии и планирует в течение ближайших шести месяцев нанять 200 сотрудников в А
Рекомендации по связанным специальным темам
Комментарии (0)
31 марта компания Ant Lingbo Technology официально открыла доступ к крупномасштабному набору данных RGB-D под названием LingBot-Depth-Dataset. Этот набор содержит 3 миллиона пар высококачественных образцов, из которых 2 миллиона были сняты в реальных условиях, а 1 миллион — синтезированы. Общий объем набора составляет 2,71 ТБ, он включает данные с шести популярных камер глубины, что делает его крупнейшим набором данных RGB-D с открытым исходным кодом, основанным преимущественно на реальных сценах. Этот релиз предоставляет более богатые и реалистичные данные для продвижения исследований в области воплощенного интеллекта, пространственного восприятия и 3D-зрения.

(Изображение: образец из LingBot-Depth-Dataset. Сверху вниз: RGB-изображение, необработанная карта глубины датчика и эталонная карта глубины. Набор данных предоставляет как необработанную, так и эталонную информацию о глубине, обеспечивая надежную поддержку для обучения и оценки моделей в реальных условиях.)
Общедоступные наборы данных о глубине давно сталкиваются с проблемами ограниченного масштаба, недостаточного охвата реальных сцен и зависимости от отдельных типов оборудования. Многие наборы данных в основном являются синтетическими и демонстрируют значительные пробелы по сравнению с реальными данными датчиков с точки зрения моделей шума, провалов глубины и представления материалов, что препятствует практическому внедрению обученных моделей.
Набор данных LingBot-Depth-Dataset эффективно устраняет этот пробел в данных о пространственном восприятии, предоставляя крупномасштабные снимки реальных сцен. Каждый образец включает в себя RGB-изображение, необработанную карту глубины с датчика и соответствующую карту глубины «ground truth», что делает его непосредственно применимым для обучения и оценки моделей оценки глубины и восстановления глубины. Он поддерживает шесть популярных камер глубины — Orbbec 335, 335L, а также Intel RealSense D405, D415, D435, D455 — что способствует лучшей обобщаемости и оценке моделей на различных устройствах и в различных сценариях.
Ранее открытая высокоточная модель пространственного восприятия Ан Линбо, LingBot-Depth, была обучена с использованием этого набора данных в качестве основных данных. По сравнению с основными отраслевыми методами, такими как PromptDA и PriorDA, LingBot-Depth снижает погрешность прогнозирования глубины более чем на 70% в помещениях и примерно на 47% при задачах восстановления разреженной глубины. При внедрении эта модель позволяет коммерческим камерам глубины создавать более полные, плавные и четкие карты глубины в сложных условиях, таких как прозрачное стекло, отражающие поверхности и задний свет — и все это без модификации оборудования. В определенных сценариях ее производительность сопоставима с производительностью высококачественных камер глубины промышленного уровня.
Для академических и исследовательских учреждений эта инициатива с открытым исходным кодом снижает барьеры для сбора и аннотирования данных, ускоряя переход технологий пространственного восприятия от исследований к реальному применению. По мере того как робототехника и встроенный интеллект быстро интегрируются в физическую среду, крупномасштабные высококачественные наборы данных, основанные на реальных данных, станут важнейшей инфраструктурой для обеспечения непрерывного прогресса в отрасли.
ElevenLabs объявила о привлечении в качестве новых инвесторов компаний BlackRock, Джейми Фокса и Евы Лонгории
Компания ElevenLabs, занимающаяся разработкой голосовых ИИ-технологий, раскрыла имена дополнительных инвесторов, участвовавших в раунде финансирования серии D на сумму 500 млн долларов, о котором перв
Генеральный директор OpenAI Альтман раскритиковал Anthropic за маркетинговые приемы, продиктованные паникой
Продолжающийся публичный спор между лидерами в области искусственного интеллекта — компаниями OpenAI и Anthropic — обострился. Сэм Альтман, генеральный директор OpenAI, недавно в ходе подкаста подверг
Стартап Cursor AI, занимающийся разработкой программного обеспечения, планирует нанять 200 сотрудников в Азиатско-Тихоокеанском регионе после получения значительных инвестиций от SpaceX
Стартап Cursor, занимающийся разработкой решений в области искусственного интеллекта, объявил о масштабной глобальной экспансии и планирует в течение ближайших шести месяцев нанять 200 сотрудников в А











