Lar
A Ant Forest LingBot lança um conjunto de dados de código aberto de 2,7 TB com 2 milhões de amostras reais captadas por 6 câmeras
Em 31 de março, a Ant Lingbo Technology disponibilizou oficialmente em código aberto o conjunto de dados RGB-D em grande escala, o LingBot-Depth-Dataset. Essa coleção contém 3 milhões de pares de amostras de alta qualidade, sendo 2 milhões capturados em ambientes reais e 1 milhão gerados sinteticamente. Com um total de 2,71 TB, ele abrange dados de seis câmeras de profundidade convencionais, tornando-se o maior conjunto de dados RGB-D de código aberto baseado principalmente em cenas reais. Este lançamento fornece dados mais ricos e realistas para avançar a pesquisa em inteligência incorporada, percepção espacial e visão 3D.

(Imagem: Uma amostra do LingBot-Depth-Dataset. De cima para baixo: a imagem RGB, o mapa de profundidade bruto do sensor e o mapa de profundidade de referência. O conjunto de dados fornece informações de profundidade tanto brutas quanto de referência, oferecendo suporte robusto para o treinamento e a avaliação de modelos em condições do mundo real.)
Os conjuntos de dados de profundidade disponíveis publicamente há muito enfrentam desafios de escala limitada, cobertura inadequada de cenas do mundo real e dependência de tipos únicos de hardware. Muitos conjuntos de dados são em grande parte sintéticos, apresentando lacunas significativas em comparação com dados de sensores reais em termos de padrões de ruído, falhas de profundidade e representação de materiais, o que dificulta a implantação prática de modelos treinados.
O LingBot-Depth-Dataset aborda efetivamente essa lacuna de dados na percepção espacial, fornecendo capturas de cenas reais em grande escala. Cada amostra inclui uma imagem RGB, um mapa de profundidade bruto do sensor e um mapa de profundidade de referência correspondente, tornando-a diretamente aplicável para o treinamento e a avaliação de modelos de estimativa e preenchimento de profundidade. Ele suporta seis câmeras de profundidade populares — Orbbec 335, 335L e Intel RealSense D405, D415, D435, D455 — facilitando uma melhor generalização e avaliação do modelo em diversos dispositivos e cenários.
O modelo de percepção espacial de alta precisão de Ant Lingbo, anteriormente disponibilizado como código aberto, o LingBot-Depth, foi treinado usando este conjunto de dados como sua base. Em comparação com métodos convencionais da indústria, como PromptDA e PriorDA, o LingBot-Depth reduz o erro de previsão de profundidade em mais de 70% em cenas internas e em aproximadamente 47% em tarefas de preenchimento de profundidade esparsa. Quando implantado, esse modelo permite que câmeras de profundidade comerciais produzam mapas de profundidade mais completos, suaves e nítidos em condições desafiadoras, como vidro transparente, superfícies reflexivas e contraluz — tudo isso sem modificações de hardware. Em certos cenários, seu desempenho rivaliza com o de câmeras de profundidade de nível industrial premium.
Para instituições acadêmicas e de pesquisa, essa iniciativa de código aberto reduz as barreiras à coleta e anotação de dados, acelerando a transição das tecnologias de percepção espacial da pesquisa para a aplicação no mundo real. À medida que a robótica e a inteligência incorporada se integram rapidamente aos ambientes físicos, conjuntos de dados em grande escala e de alta qualidade, baseados em dados do mundo real, tornar-se-ão uma infraestrutura essencial para impulsionar o progresso contínuo do setor.
Artigo relacionado
Startup de programação de IA Cursor vai contratar 200 pessoas na Ásia-Pacífico após investimento significativo da SpaceX
A startup de programação de IA Cursor anunciou uma grande expansão global, com planos de contratar 200 funcionários na região da Ásia-Pacífico nos próximos seis meses. As principais vagas incluem enge
Claude foi usado para criar pacotes npm maliciosos: mais de 670 pacotes comprometidos ameaçam o código aberto
Um recente incidente de segurança cibernética revela como os grandes modelos de linguagem (LLMs) estão sendo utilizados para o desenvolvimento de software malicioso. O pesquisador de segurança Sibi Mo
A Reliance revela um plano de investimento em IA de US$ 110 bilhões, à medida que a Índia acelera sua iniciativa tecnológica
Mukesh Ambani, o bilionário presidente do conglomerado indiano Reliance, anunciou na quinta-feira um plano de 10 trilhões de rúpias (cerca de US$ 110 bilhões) para construir uma infraestrutura de comp
Recomendações de tópicos especiais relacionados
Comentários (0)
Em 31 de março, a Ant Lingbo Technology disponibilizou oficialmente em código aberto o conjunto de dados RGB-D em grande escala, o LingBot-Depth-Dataset. Essa coleção contém 3 milhões de pares de amostras de alta qualidade, sendo 2 milhões capturados em ambientes reais e 1 milhão gerados sinteticamente. Com um total de 2,71 TB, ele abrange dados de seis câmeras de profundidade convencionais, tornando-se o maior conjunto de dados RGB-D de código aberto baseado principalmente em cenas reais. Este lançamento fornece dados mais ricos e realistas para avançar a pesquisa em inteligência incorporada, percepção espacial e visão 3D.

(Imagem: Uma amostra do LingBot-Depth-Dataset. De cima para baixo: a imagem RGB, o mapa de profundidade bruto do sensor e o mapa de profundidade de referência. O conjunto de dados fornece informações de profundidade tanto brutas quanto de referência, oferecendo suporte robusto para o treinamento e a avaliação de modelos em condições do mundo real.)
Os conjuntos de dados de profundidade disponíveis publicamente há muito enfrentam desafios de escala limitada, cobertura inadequada de cenas do mundo real e dependência de tipos únicos de hardware. Muitos conjuntos de dados são em grande parte sintéticos, apresentando lacunas significativas em comparação com dados de sensores reais em termos de padrões de ruído, falhas de profundidade e representação de materiais, o que dificulta a implantação prática de modelos treinados.
O LingBot-Depth-Dataset aborda efetivamente essa lacuna de dados na percepção espacial, fornecendo capturas de cenas reais em grande escala. Cada amostra inclui uma imagem RGB, um mapa de profundidade bruto do sensor e um mapa de profundidade de referência correspondente, tornando-a diretamente aplicável para o treinamento e a avaliação de modelos de estimativa e preenchimento de profundidade. Ele suporta seis câmeras de profundidade populares — Orbbec 335, 335L e Intel RealSense D405, D415, D435, D455 — facilitando uma melhor generalização e avaliação do modelo em diversos dispositivos e cenários.
O modelo de percepção espacial de alta precisão de Ant Lingbo, anteriormente disponibilizado como código aberto, o LingBot-Depth, foi treinado usando este conjunto de dados como sua base. Em comparação com métodos convencionais da indústria, como PromptDA e PriorDA, o LingBot-Depth reduz o erro de previsão de profundidade em mais de 70% em cenas internas e em aproximadamente 47% em tarefas de preenchimento de profundidade esparsa. Quando implantado, esse modelo permite que câmeras de profundidade comerciais produzam mapas de profundidade mais completos, suaves e nítidos em condições desafiadoras, como vidro transparente, superfícies reflexivas e contraluz — tudo isso sem modificações de hardware. Em certos cenários, seu desempenho rivaliza com o de câmeras de profundidade de nível industrial premium.
Para instituições acadêmicas e de pesquisa, essa iniciativa de código aberto reduz as barreiras à coleta e anotação de dados, acelerando a transição das tecnologias de percepção espacial da pesquisa para a aplicação no mundo real. À medida que a robótica e a inteligência incorporada se integram rapidamente aos ambientes físicos, conjuntos de dados em grande escala e de alta qualidade, baseados em dados do mundo real, tornar-se-ão uma infraestrutura essencial para impulsionar o progresso contínuo do setor.
Startup de programação de IA Cursor vai contratar 200 pessoas na Ásia-Pacífico após investimento significativo da SpaceX
A startup de programação de IA Cursor anunciou uma grande expansão global, com planos de contratar 200 funcionários na região da Ásia-Pacífico nos próximos seis meses. As principais vagas incluem enge
Claude foi usado para criar pacotes npm maliciosos: mais de 670 pacotes comprometidos ameaçam o código aberto
Um recente incidente de segurança cibernética revela como os grandes modelos de linguagem (LLMs) estão sendo utilizados para o desenvolvimento de software malicioso. O pesquisador de segurança Sibi Mo
A Reliance revela um plano de investimento em IA de US$ 110 bilhões, à medida que a Índia acelera sua iniciativa tecnológica
Mukesh Ambani, o bilionário presidente do conglomerado indiano Reliance, anunciou na quinta-feira um plano de 10 trilhões de rúpias (cerca de US$ 110 bilhões) para construir uma infraestrutura de comp











