AI驅動的新開放建築數據集的開發已揭曉

2021年,Google Research Africa團隊啟動了Open Buildings,這是一個開源數據集,利用AI和高分辨率衛星影像繪製全球南方的建築足跡。他們的目標相當直接:填補發展中國家人口與密度數據的重大缺口。現在,第三版數據集已經發布,涵蓋非洲、南亞、東南亞、拉丁美洲和加勒比地區,面積達5800萬平方公里,包含18億棟建築的 polygon 數據。
許多人,包括政府、聯合國、研究人員和非營利組織,都在使用Open Buildings來掌握人口規模和分佈情況。這幫助他們更好地規劃疫苗接種活動和災害應對。此外,它還通過添加數百萬此前未繪製的建築,增強了Google Maps的功能。
位於迦納的團隊,成員分佈在特拉維夫和蘇黎世等地,一直致力於讓這個項目更具實用性。Google Research項目經理Abdoulaye Diack表示:「我們總是處於黑客松模式,嘗試新想法並應對挑戰。原始數據集無法展示區域隨時間的變化,它是靜態的。而這是我們的合作夥伴非常想要的功能。」
商業衛星影像提供商通常專注於能帶來收益的地區,導致全球約40%的地區,主要是全球南方,缺乏定期的高分辨率覆蓋。一些偏遠地區和非正式定居點甚至完全沒有覆蓋。同時,來自歐洲太空總署的Sentinel-2衛星提供的開源影像,每五天拍攝一次全球圖片,但被認為分辨率太低,無法用於建築檢測。
但團隊認為這可能不是什麼大問題,於是他們嘗試了一下。
首先,他們將Sentinel-2的單一低分辨率幀輸入模型,要求繪製建築 polygon。「這很困難,但我們看到了潛力,」Abdoulaye說。「於是我們讓模型僅給我們建築掩膜—與特定地點相關的二進制像素數據。結果還不錯,我們覺得,『嘿,我們可以做到。』」
經過一年的模型調整,他們於上個月推出了Open Buildings 2.5D Temporal Dataset,涵蓋2016至2023年,提供了全球南方大部分地區的建築存在和數量的年度快照,以及建築高度。這展示了城市因發展、災害等因素的變化。用戶可以選擇一個地區,翻閱年份,觀看世界以多彩的形狀展示增長與縮減。
Google Research產品經理Olivia Graham表示:「到2050年,約有25億人可能會遷入城市,主要在全球南方。這個數據集對政府和組織應對這種增長可能是一個改變遊戲規則的工具。如果一個城市在規劃醫療和教育等基本服務的佈局,或決定在哪裡建設水和能源供應等基礎設施,這個數據集能顯示哪些地區正在快速增長。」
2018年9月28日,印尼海岸發生7.4級大地震,引發海嘯,影響蘇拉威西約150萬人。數據集顯示災後沿海地區的建築面積後退。你可以在我們的互動式Earth Engine應用程式中查看。
你也可以在Open Buildings 2.5D Temporal Dataset演示中看到埃及新開羅的建設。
那麼,團隊是如何讓模型讀取Sentinel-2的模糊衛星影像並自信地檢測建築的呢?他們從提高清晰度開始。
Google Research軟件工程師Krishna Sapkota表示:「我們使用了教師-學生模型設置,同時對低分辨率影像進行『超分辨率』處理並提取建築足跡。教師模型學會在高分辨率影像中識別建築,並為學生模型提供標籤。學生模型實際上創建數據集,從教師的輸出中學習。它能從Sentinel-2的低分辨率影像中推測高分辨率版本的樣子。」
教師模型為學生模型提供高分辨率訓練標籤,學生模型則從低分辨率影像中推斷建築存在。
為了獲得建築足跡所需的細節,模型使用最多32�フレーム的Sentinel-2影像進行預測。每幀因拍攝時間的微小差異而略有不同,這有助於提高分辨率—有點像Pixel手機使用多張照片來獲得更清晰的影像。
與提供精確建築 polygon 輪廓的原始數據集不同,新的時序數據集使用光柵數據來表示建築足跡。它還預測建築高度,這對估計人口密度至關重要,誤差僅為1.5米,不到一層樓。
在正式發布前,時序數據集已與可信合作夥伴如烏干達非營利組織Sunbird AI共享。Olivia說:「約73%的烏干達人沒有電力,Sunbird AI使用我們的原始數據庫幫助政府確定在哪裡放置微電網或太陽能板。有了新數據集,他們正在研究Jinja和Fort Portal,創建視覺化內容,幫助市議會看到哪些地區增長很快並調整計劃。這顯示了兩個數據集如何成為理解人口及其變化更大工具包的一部分。」
推動時序數據集誕生的好奇心,也在推動團隊不斷改進。
Abdoulaye說:「我住在迦納,看到我們的工作正在產生並將產生的影響。這裡許多地方資源匱乏,導致數據缺口帶來嚴重後果。能成為解決這一問題並產生影響的團隊一員,真的是一種榮幸。」
相關文章
Meta增強AI安全以先進Llama工具
Meta已發布全新Llama安全工具,以強化AI開發並防範新興威脅。這些升級的Llama AI模型安全工具與Meta的新資源搭配,旨在賦能網路安全團隊利用AI進行防禦,提升所有AI利益相關者的安全性。使用Llama模型的開發者現可直接在Meta的Llama Protections頁面、Hugging Face及GitHub上獲得增強工具。Llama Guard 4引入多模態功能,支持文字與圖像的安
NotebookLM推出頂尖出版物與專家精選筆記本
Google正在增強其AI驅動的研究與筆記工具NotebookLM,使其成為一個全面的知識中心。週一,該公司推出了一個由知名作者、出版物、研究人員和非營利組織提供的精選筆記本集合,讓使用者能夠探索健康、旅遊、財經等多樣化主題。首批內容包括來自《經濟學人》、《大西洋月刊》、知名教授、作者,甚至莎士比亞作品的貢獻,展示NotebookLM在深入主題探索中的實際應用。Google解釋說,使用者可以存取原
阿里巴巴推出Wan2.1-VACE:開源AI視頻解決方案
阿里巴巴推出了Wan2.1-VACE,一款開源AI模型,旨在改變視頻創作與編輯流程。VACE是阿里巴巴Wan2.1視頻AI模型系列的關鍵組成部分,公司宣稱這是「業界首個為多樣化視頻生成與編輯任務提供全面解決方案的開源模型」。如果阿里巴巴能夠簡化視頻製作流程,將多種工具整合到單一平台,可能會重新定義行業標準。VACE能做什麼?它可以從多種輸入生成視頻,例如文字提示、靜態圖像或短視頻片段。除了視頻創作
評論 (27)
0/200
JustinHarris
2025-07-31 09:41:20
Super cool to see AI mapping buildings in the Global South! 😮 Makes me wonder how this could help urban planning or disaster response.
0
KennethJohnson
2025-07-22 14:33:07
This dataset sounds like a game-changer for urban planning! 😮 I wonder how accurate those AI-mapped footprints are compared to real-world buildings.
0
CarlHill
2025-04-19 03:10:36
新しいオープンビルディングデータセットのAI駆動開発はすごくクール!AIと衛星画像でグローバルサウスの建物のフットプリントをマッピングできるなんて驚きだ。でも、データが少し圧倒的すぎる。とはいえ、人口密度を理解するのに素晴らしいツールだよ!🌍📊
0
LarryMartin
2025-04-18 00:08:18
새로운 오픈 빌딩 데이터셋의 AI 기반 개발은 정말 멋져요! AI와 위성 이미지를 통해 글로벌 사우스의 건물 발자국을 매핑할 수 있다는 게 놀랍네요. 하지만 데이터가 조금 압도적이에요. 그래도 인구 밀도를 이해하는 데 좋은 도구예요! 🌍📊
0
StevenGreen
2025-04-16 12:37:39
El Desarrollo Impulsado por IA del Nuevo Conjunto de Datos de Edificios Abiertos es súper genial. Es increíble cómo la IA y las imágenes satelitales pueden mapear las huellas de los edificios en el Sur Global. Pero, los datos pueden ser un poco abrumadores. Aún así, es una gran herramienta para entender la densidad de población. 🌍📊
0
AlbertScott
2025-04-14 19:26:14
The AI-Driven Development of New Open Buildings Dataset is super cool! It's amazing how AI and satellite imagery can map building footprints in the Global South. But, the data can be a bit overwhelming. Still, it's a great tool for understanding population density! 🌍📊
0
2021年,Google Research Africa團隊啟動了Open Buildings,這是一個開源數據集,利用AI和高分辨率衛星影像繪製全球南方的建築足跡。他們的目標相當直接:填補發展中國家人口與密度數據的重大缺口。現在,第三版數據集已經發布,涵蓋非洲、南亞、東南亞、拉丁美洲和加勒比地區,面積達5800萬平方公里,包含18億棟建築的 polygon 數據。
許多人,包括政府、聯合國、研究人員和非營利組織,都在使用Open Buildings來掌握人口規模和分佈情況。這幫助他們更好地規劃疫苗接種活動和災害應對。此外,它還通過添加數百萬此前未繪製的建築,增強了Google Maps的功能。
商業衛星影像提供商通常專注於能帶來收益的地區,導致全球約40%的地區,主要是全球南方,缺乏定期的高分辨率覆蓋。一些偏遠地區和非正式定居點甚至完全沒有覆蓋。同時,來自歐洲太空總署的Sentinel-2衛星提供的開源影像,每五天拍攝一次全球圖片,但被認為分辨率太低,無法用於建築檢測。
但團隊認為這可能不是什麼大問題,於是他們嘗試了一下。
首先,他們將Sentinel-2的單一低分辨率幀輸入模型,要求繪製建築 polygon。「這很困難,但我們看到了潛力,」Abdoulaye說。「於是我們讓模型僅給我們建築掩膜—與特定地點相關的二進制像素數據。結果還不錯,我們覺得,『嘿,我們可以做到。』」
經過一年的模型調整,他們於上個月推出了Open Buildings 2.5D Temporal Dataset,涵蓋2016至2023年,提供了全球南方大部分地區的建築存在和數量的年度快照,以及建築高度。這展示了城市因發展、災害等因素的變化。用戶可以選擇一個地區,翻閱年份,觀看世界以多彩的形狀展示增長與縮減。
Google Research產品經理Olivia Graham表示:「到2050年,約有25億人可能會遷入城市,主要在全球南方。這個數據集對政府和組織應對這種增長可能是一個改變遊戲規則的工具。如果一個城市在規劃醫療和教育等基本服務的佈局,或決定在哪裡建設水和能源供應等基礎設施,這個數據集能顯示哪些地區正在快速增長。」
那麼,團隊是如何讓模型讀取Sentinel-2的模糊衛星影像並自信地檢測建築的呢?他們從提高清晰度開始。
Google Research軟件工程師Krishna Sapkota表示:「我們使用了教師-學生模型設置,同時對低分辨率影像進行『超分辨率』處理並提取建築足跡。教師模型學會在高分辨率影像中識別建築,並為學生模型提供標籤。學生模型實際上創建數據集,從教師的輸出中學習。它能從Sentinel-2的低分辨率影像中推測高分辨率版本的樣子。」
為了獲得建築足跡所需的細節,模型使用最多32�フレーム的Sentinel-2影像進行預測。每幀因拍攝時間的微小差異而略有不同,這有助於提高分辨率—有點像Pixel手機使用多張照片來獲得更清晰的影像。
與提供精確建築 polygon 輪廓的原始數據集不同,新的時序數據集使用光柵數據來表示建築足跡。它還預測建築高度,這對估計人口密度至關重要,誤差僅為1.5米,不到一層樓。
在正式發布前,時序數據集已與可信合作夥伴如烏干達非營利組織Sunbird AI共享。Olivia說:「約73%的烏干達人沒有電力,Sunbird AI使用我們的原始數據庫幫助政府確定在哪裡放置微電網或太陽能板。有了新數據集,他們正在研究Jinja和Fort Portal,創建視覺化內容,幫助市議會看到哪些地區增長很快並調整計劃。這顯示了兩個數據集如何成為理解人口及其變化更大工具包的一部分。」
推動時序數據集誕生的好奇心,也在推動團隊不斷改進。
Abdoulaye說:「我住在迦納,看到我們的工作正在產生並將產生的影響。這裡許多地方資源匱乏,導致數據缺口帶來嚴重後果。能成為解決這一問題並產生影響的團隊一員,真的是一種榮幸。」


Super cool to see AI mapping buildings in the Global South! 😮 Makes me wonder how this could help urban planning or disaster response.




This dataset sounds like a game-changer for urban planning! 😮 I wonder how accurate those AI-mapped footprints are compared to real-world buildings.




新しいオープンビルディングデータセットのAI駆動開発はすごくクール!AIと衛星画像でグローバルサウスの建物のフットプリントをマッピングできるなんて驚きだ。でも、データが少し圧倒的すぎる。とはいえ、人口密度を理解するのに素晴らしいツールだよ!🌍📊




새로운 오픈 빌딩 데이터셋의 AI 기반 개발은 정말 멋져요! AI와 위성 이미지를 통해 글로벌 사우스의 건물 발자국을 매핑할 수 있다는 게 놀랍네요. 하지만 데이터가 조금 압도적이에요. 그래도 인구 밀도를 이해하는 데 좋은 도구예요! 🌍📊




El Desarrollo Impulsado por IA del Nuevo Conjunto de Datos de Edificios Abiertos es súper genial. Es increíble cómo la IA y las imágenes satelitales pueden mapear las huellas de los edificios en el Sur Global. Pero, los datos pueden ser un poco abrumadores. Aún así, es una gran herramienta para entender la densidad de población. 🌍📊




The AI-Driven Development of New Open Buildings Dataset is super cool! It's amazing how AI and satellite imagery can map building footprints in the Global South. But, the data can be a bit overwhelming. Still, it's a great tool for understanding population density! 🌍📊












