Développement basé sur l'IA de nouveaux ensembles de données Open Buildings dévoilés

En 2021, l'équipe Google Research Africa a lancé Open Buildings, un ensemble de données open-source cartographiant les empreintes de bâtiments dans le Sud global à l'aide de l'IA et d'images satellites haute résolution. Leur objectif était simple : combler un grand vide dans les données sur la population et la densité dans les pays en développement. Maintenant, avec la troisième version, leur ensemble de données compte des polygones pour 1,8 milliard de bâtiments sur 58 millions de km² en Afrique, Asie du Sud et du Sud-Est, Amérique latine et Caraïbes.
De nombreux acteurs, des gouvernements à l'ONU, en passant par les chercheurs et les ONG, utilisent Open Buildings pour mieux comprendre la taille et la répartition de la population. Cela les aide à mieux planifier des campagnes de vaccination ou des réponses aux catastrophes. De plus, cela a enrichi Google Maps en ajoutant des millions de bâtiments non cartographiés auparavant.
L'équipe, basée au Ghana mais avec des membres dispersés à Tel Aviv ou Zurich, travaille à rendre le projet encore plus utile. « Nous sommes toujours en mode hackathon, testant de nouvelles idées et relevant des défis », explique Abdoulaye Diack, responsable de programme chez Google Research. « Avec l'ensemble de données initial, nous ne pouvions pas montrer l'évolution des zones au fil du temps – il était statique. C'était une demande forte de nos partenaires. »
Les fournisseurs d'images satellites commerciales se concentrent sur les zones rentables, laissant environ 40 % du monde, principalement le Sud global, sans couverture régulière en haute résolution. Certaines zones reculées et habitats informels n'ont aucune couverture. Les images open-source du satellite Sentinel-2 de l'Agence spatiale européenne, prises tous les cinq jours, étaient considérées comme trop basse résolution pour détecter les bâtiments.
Mais l'équipe a pensé que cela valait la peine d'essayer.
Ils ont d'abord introduit une image basse résolution de Sentinel-2 dans leur modèle, lui demandant de dessiner des polygones de bâtiments. « C'était difficile, mais nous y avons vu du potentiel », dit Abdoulaye. « Nous avons donc demandé au modèle de fournir uniquement les masques de bâtiments – des données binaires de pixels liées à des emplacements précis. Ça fonctionnait, et nous nous sommes dit : "On peut y arriver." »
Après un an d'ajustements, ils ont lancé le mois dernier l'ensemble de données temporel Open Buildings 2.5D. Il couvre 2016 à 2023, offrant un instantané annuel de la présence et du nombre de bâtiments dans une grande partie du Sud global, ainsi que leurs hauteurs. Cela montre comment les villes évoluent avec le développement, les catastrophes et autres facteurs. Les utilisateurs peuvent choisir une région, parcourir les années et observer le monde croître ou rétrécir dans un affichage coloré de formes.
« D'ici 2050, environ 2,5 milliards de personnes supplémentaires pourraient migrer vers les villes, principalement dans le Sud global. Cet ensemble de données pourrait changer la donne pour les gouvernements et organisations gérant cette croissance », explique Olivia Graham, responsable produit chez Google Research. « Si une ville planifie où installer des services essentiels comme la santé ou l'éducation, ou où construire des infrastructures comme l'eau et l'énergie, cet ensemble de données montre quelles zones croissent rapidement. »
Le 28 septembre 2018, un séisme de magnitude 7,4 au large de l'Indonésie a déclenché un tsunami, touchant environ 1,5 million de personnes à Sulawesi. L'ensemble de données montre comment la zone bâtie s'est retirée de la côte après la catastrophe. Vous pouvez l'explorer dans notre application interactive Earth Engine.
Vous pouvez également voir la construction du Nouveau Caire, Égypte, dans la démo de l'ensemble de données temporel Open Buildings 2.5D.
Comment l'équipe a-t-elle réussi à faire lire au modèle les images satellites floues de Sentinel-2 et détecter les bâtiments avec confiance ? Ils ont commencé par affiner la netteté.
« Nous avons utilisé une configuration de modèle enseignant-élève pour à la fois "super-résoudre" les images basse résolution et extraire les empreintes de bâtiments », explique Krishna Sapkota, ingénieur logiciel chez Google Research. « Le modèle enseignant apprend à repérer les bâtiments dans des images haute résolution et fournit des étiquettes au modèle élève. Ce dernier, qui crée l'ensemble de données, apprend à partir des résultats de l'enseignant. Il peut alors prendre des images basse résolution de Sentinel-2 et estimer à quoi ressemblerait une version plus nette. »
Le modèle enseignant fournit des étiquettes d'entraînement haute résolution au modèle élève, qui détermine ensuite la présence de bâtiments à partir d'images basse résolution.
Pour obtenir les détails nécessaires aux empreintes de bâtiments, le modèle utilise jusqu'à 32 images Sentinel-2 d'un même endroit pour chaque prédiction. Chaque image est légèrement différente, grâce au léger décalage temporel entre les captures, ce qui améliore la résolution – un peu comme les téléphones Pixel utilisent plusieurs clichés pour des images plus nettes.
Contrairement à l'ensemble de données initial, qui donnait des contours polygonaux précis des bâtiments, le nouvel ensemble de données temporel utilise des données raster pour les empreintes de bâtiments. Il prédit également les hauteurs des bâtiments, cruciales pour estimer la densité de population, avec une erreur de seulement 1,5 mètre, soit moins d'un étage.
Avant sa sortie officielle, l'ensemble de données temporel a été partagé avec des partenaires de confiance comme l'ONG ougandaise Sunbird AI. « Environ 73 % des Ougandais n'ont pas d'électricité, et Sunbird AI a utilisé notre base de données initiale pour aider le gouvernement à déterminer où installer des micro-réseaux ou des panneaux solaires », explique Olivia. « Avec le nouvel ensemble, ils étudient Jinja et Fort Portal, créant des visuels qui aident les conseils municipaux à voir où la croissance est rapide et à ajuster leurs plans. Cela montre comment les deux ensembles peuvent faire partie d'une boîte à outils plus large pour comprendre une population et son évolution. »
La même curiosité qui a conduit à l'ensemble de données temporel pousse l'équipe à continuer de l'améliorer.
« Je vis au Ghana et je vois l'impact de notre travail », dit Abdoulaye. « Beaucoup d'endroits ici manquent de ressources, ce qui crée des lacunes de données aux grandes conséquences. Faire partie d'une équipe qui travaille à combler ces lacunes et à faire une différence est un véritable honneur. »
Article connexe
Meta Renforce la Sécurité IA avec des Outils Llama Avancés
Meta a publié de nouveaux outils de sécurité Llama pour renforcer le développement IA et protéger contre les menaces émergentes.Ces outils de sécurité du modèle IA Llama améliorés sont associés aux no
NotebookLM Dévoile des Carnets Sélectionnés de Publications de Premier Plan et d'Experts
Google améliore son outil de recherche et de prise de notes alimenté par l'IA, NotebookLM, pour en faire un centre de connaissances complet. Lundi, l'entreprise a présenté une collection de carnets so
Alibaba Dévoile Wan2.1-VACE : Solution Vidéo IA Open-Source
Alibaba a présenté Wan2.1-VACE, un modèle d'IA open-source prêt à transformer les processus de création et d'édition vidéo.VACE est un composant clé de la famille de modèles vidéo IA Wan2.1 d’Alibaba,
commentaires (27)
0/200
JustinHarris
31 juillet 2025 03:41:20 UTC+02:00
Super cool to see AI mapping buildings in the Global South! 😮 Makes me wonder how this could help urban planning or disaster response.
0
KennethJohnson
22 juillet 2025 08:33:07 UTC+02:00
This dataset sounds like a game-changer for urban planning! 😮 I wonder how accurate those AI-mapped footprints are compared to real-world buildings.
0
CarlHill
18 avril 2025 21:10:36 UTC+02:00
新しいオープンビルディングデータセットのAI駆動開発はすごくクール!AIと衛星画像でグローバルサウスの建物のフットプリントをマッピングできるなんて驚きだ。でも、データが少し圧倒的すぎる。とはいえ、人口密度を理解するのに素晴らしいツールだよ!🌍📊
0
LarryMartin
17 avril 2025 18:08:18 UTC+02:00
새로운 오픈 빌딩 데이터셋의 AI 기반 개발은 정말 멋져요! AI와 위성 이미지를 통해 글로벌 사우스의 건물 발자국을 매핑할 수 있다는 게 놀랍네요. 하지만 데이터가 조금 압도적이에요. 그래도 인구 밀도를 이해하는 데 좋은 도구예요! 🌍📊
0
StevenGreen
16 avril 2025 06:37:39 UTC+02:00
El Desarrollo Impulsado por IA del Nuevo Conjunto de Datos de Edificios Abiertos es súper genial. Es increíble cómo la IA y las imágenes satelitales pueden mapear las huellas de los edificios en el Sur Global. Pero, los datos pueden ser un poco abrumadores. Aún así, es una gran herramienta para entender la densidad de población. 🌍📊
0
AlbertScott
14 avril 2025 13:26:14 UTC+02:00
The AI-Driven Development of New Open Buildings Dataset is super cool! It's amazing how AI and satellite imagery can map building footprints in the Global South. But, the data can be a bit overwhelming. Still, it's a great tool for understanding population density! 🌍📊
0
En 2021, l'équipe Google Research Africa a lancé Open Buildings, un ensemble de données open-source cartographiant les empreintes de bâtiments dans le Sud global à l'aide de l'IA et d'images satellites haute résolution. Leur objectif était simple : combler un grand vide dans les données sur la population et la densité dans les pays en développement. Maintenant, avec la troisième version, leur ensemble de données compte des polygones pour 1,8 milliard de bâtiments sur 58 millions de km² en Afrique, Asie du Sud et du Sud-Est, Amérique latine et Caraïbes.
De nombreux acteurs, des gouvernements à l'ONU, en passant par les chercheurs et les ONG, utilisent Open Buildings pour mieux comprendre la taille et la répartition de la population. Cela les aide à mieux planifier des campagnes de vaccination ou des réponses aux catastrophes. De plus, cela a enrichi Google Maps en ajoutant des millions de bâtiments non cartographiés auparavant.
Les fournisseurs d'images satellites commerciales se concentrent sur les zones rentables, laissant environ 40 % du monde, principalement le Sud global, sans couverture régulière en haute résolution. Certaines zones reculées et habitats informels n'ont aucune couverture. Les images open-source du satellite Sentinel-2 de l'Agence spatiale européenne, prises tous les cinq jours, étaient considérées comme trop basse résolution pour détecter les bâtiments.
Mais l'équipe a pensé que cela valait la peine d'essayer.
Ils ont d'abord introduit une image basse résolution de Sentinel-2 dans leur modèle, lui demandant de dessiner des polygones de bâtiments. « C'était difficile, mais nous y avons vu du potentiel », dit Abdoulaye. « Nous avons donc demandé au modèle de fournir uniquement les masques de bâtiments – des données binaires de pixels liées à des emplacements précis. Ça fonctionnait, et nous nous sommes dit : "On peut y arriver." »
Après un an d'ajustements, ils ont lancé le mois dernier l'ensemble de données temporel Open Buildings 2.5D. Il couvre 2016 à 2023, offrant un instantané annuel de la présence et du nombre de bâtiments dans une grande partie du Sud global, ainsi que leurs hauteurs. Cela montre comment les villes évoluent avec le développement, les catastrophes et autres facteurs. Les utilisateurs peuvent choisir une région, parcourir les années et observer le monde croître ou rétrécir dans un affichage coloré de formes.
« D'ici 2050, environ 2,5 milliards de personnes supplémentaires pourraient migrer vers les villes, principalement dans le Sud global. Cet ensemble de données pourrait changer la donne pour les gouvernements et organisations gérant cette croissance », explique Olivia Graham, responsable produit chez Google Research. « Si une ville planifie où installer des services essentiels comme la santé ou l'éducation, ou où construire des infrastructures comme l'eau et l'énergie, cet ensemble de données montre quelles zones croissent rapidement. »
Comment l'équipe a-t-elle réussi à faire lire au modèle les images satellites floues de Sentinel-2 et détecter les bâtiments avec confiance ? Ils ont commencé par affiner la netteté.
« Nous avons utilisé une configuration de modèle enseignant-élève pour à la fois "super-résoudre" les images basse résolution et extraire les empreintes de bâtiments », explique Krishna Sapkota, ingénieur logiciel chez Google Research. « Le modèle enseignant apprend à repérer les bâtiments dans des images haute résolution et fournit des étiquettes au modèle élève. Ce dernier, qui crée l'ensemble de données, apprend à partir des résultats de l'enseignant. Il peut alors prendre des images basse résolution de Sentinel-2 et estimer à quoi ressemblerait une version plus nette. »
Pour obtenir les détails nécessaires aux empreintes de bâtiments, le modèle utilise jusqu'à 32 images Sentinel-2 d'un même endroit pour chaque prédiction. Chaque image est légèrement différente, grâce au léger décalage temporel entre les captures, ce qui améliore la résolution – un peu comme les téléphones Pixel utilisent plusieurs clichés pour des images plus nettes.
Contrairement à l'ensemble de données initial, qui donnait des contours polygonaux précis des bâtiments, le nouvel ensemble de données temporel utilise des données raster pour les empreintes de bâtiments. Il prédit également les hauteurs des bâtiments, cruciales pour estimer la densité de population, avec une erreur de seulement 1,5 mètre, soit moins d'un étage.
Avant sa sortie officielle, l'ensemble de données temporel a été partagé avec des partenaires de confiance comme l'ONG ougandaise Sunbird AI. « Environ 73 % des Ougandais n'ont pas d'électricité, et Sunbird AI a utilisé notre base de données initiale pour aider le gouvernement à déterminer où installer des micro-réseaux ou des panneaux solaires », explique Olivia. « Avec le nouvel ensemble, ils étudient Jinja et Fort Portal, créant des visuels qui aident les conseils municipaux à voir où la croissance est rapide et à ajuster leurs plans. Cela montre comment les deux ensembles peuvent faire partie d'une boîte à outils plus large pour comprendre une population et son évolution. »
La même curiosité qui a conduit à l'ensemble de données temporel pousse l'équipe à continuer de l'améliorer.
« Je vis au Ghana et je vois l'impact de notre travail », dit Abdoulaye. « Beaucoup d'endroits ici manquent de ressources, ce qui crée des lacunes de données aux grandes conséquences. Faire partie d'une équipe qui travaille à combler ces lacunes et à faire une différence est un véritable honneur. »


Super cool to see AI mapping buildings in the Global South! 😮 Makes me wonder how this could help urban planning or disaster response.




This dataset sounds like a game-changer for urban planning! 😮 I wonder how accurate those AI-mapped footprints are compared to real-world buildings.




新しいオープンビルディングデータセットのAI駆動開発はすごくクール!AIと衛星画像でグローバルサウスの建物のフットプリントをマッピングできるなんて驚きだ。でも、データが少し圧倒的すぎる。とはいえ、人口密度を理解するのに素晴らしいツールだよ!🌍📊




새로운 오픈 빌딩 데이터셋의 AI 기반 개발은 정말 멋져요! AI와 위성 이미지를 통해 글로벌 사우스의 건물 발자국을 매핑할 수 있다는 게 놀랍네요. 하지만 데이터가 조금 압도적이에요. 그래도 인구 밀도를 이해하는 데 좋은 도구예요! 🌍📊




El Desarrollo Impulsado por IA del Nuevo Conjunto de Datos de Edificios Abiertos es súper genial. Es increíble cómo la IA y las imágenes satelitales pueden mapear las huellas de los edificios en el Sur Global. Pero, los datos pueden ser un poco abrumadores. Aún así, es una gran herramienta para entender la densidad de población. 🌍📊




The AI-Driven Development of New Open Buildings Dataset is super cool! It's amazing how AI and satellite imagery can map building footprints in the Global South. But, the data can be a bit overwhelming. Still, it's a great tool for understanding population density! 🌍📊












