新しいオープンビルディングデータセットのAI駆動型開発が発表されました

2021年、Google Research Africaチームは、AIと高解像度衛星画像を使用してグローバルサウスの建物フットプリントをマッピングするオープンソースデータセット「Open Buildings」を開始しました。目的はシンプルで、発展途上国の人口と密度に関するデータの大きなギャップを埋めることでした。現在、3番目のバージョンが公開され、このデータセットはアフリカ、南および東南アジア、ラテンアメリカ、カリブ海にわたる5800万平方キロメートルで18億の建物のポリゴンを誇ります。
政府から国連、研究者、非営利団体まで多くの人々が、Open Buildingsを使用して人口規模と分布を把握しています。これにより、ワクチン接種キャンペーンや災害対応の計画が改善されました。また、Google Mapsにこれまでマッピングされていなかった数百万の建物を追加し、強化しました。
ガーナに拠点を置き、テルアビブやチューリッヒなど各地にメンバーが散らばるチームは、プロジェクトをさらに役立つものにする使命を負っています。「私たちは常にハッカソンモードで、新しいアイデアを試し、課題に取り組んでいます」と、Google Researchのプログラムマネージャー、アブドゥライエ・ディアックは言います。「元のデータセットでは、時間の経過に伴う地域の変化を示すことができませんでした。それは静的でした。それがパートナーが本当に望んでいたことでした。」
商用衛星画像プロバイダーは通常、収益を上げる地域に焦点を当て、世界の約40%、主にグローバルサウスを定期的な高解像度カバレッジから除外します。遠隔地や非公式の居住地は全くカバーされないこともあります。一方、欧州宇宙機関のSentinel-2衛星からのオープンソース画像は、5日ごとに全球を撮影しますが、建物検出には解像度が低すぎると考えられていました。
しかし、チームはそれが思ったほど大きな問題ではないかもしれないと考え、試してみました。
最初に、Sentinel-2の低解像度フレームをモデルに入力し、建物のポリゴンを描くように依頼しました。「難しかったですが、可能性を見ました」とアブドゥライエは言います。「そこで、モデルに建物のマスク—特定の地点に結びついたバイナリピクセルデータ—だけを提供するように指示しました。まずまずの結果で、『これはいける』と思いました。」
モデルの調整に1年を費やした後、先月、Open Buildings 2.5D Temporal Datasetを公開しました。これは2016年から2023年をカバーし、グローバルサウスの多くの地域で建物の存在と数の年次スナップショットを提供し、建物の高さも示します。これにより、開発、災害、その他の要因による都市の変化がわかります。ユーザーは地域を選び、年を切り替えて、カラフルな形状の表示で世界の成長と縮小を見ることができます。
「2050年までに、約25億人が都市に移住する可能性があり、そのほとんどがグローバルサウスです。このデータセットは、その成長に対処する政府や組織にとってゲームチェンジャーになる可能性があります」と、Google Researchのプロダクトマネージャー、オリビア・グラハムは言います。「都市が医療や教育などの必須サービスをどこに配置するか、または水やエネルギー供給のインフラをどこに構築するかを計画する場合、このデータセットはどの地域が急速に成長しているかを示します。」
2018年9月28日、インドネシア沿岸で発生したマグニチュード7.4の巨大地震が津波を引き起こし、スラウェシ島の約150万人が影響を受けました。データセットは、災害後に海岸から建築エリアが後退した様子を示しています。これは私たちのインタラクティブなEarth Engineアプリで確認できます。
エジプトのニューカイロの建設も、Open Buildings 2.5D Temporal Datasetのデモで見ることができます。
では、チームはどのようにしてSentinel-2のぼやけた衛星画像を読み取り、自信を持って建物を検出するモデルを作ったのでしょうか?彼らはまず、画像を鮮明にすることから始めました。
「私たちは、教師-生徒モデル設定を使用して、低解像度画像を『超解像度化』し、建物のフットプリントを引き出しました」と、Google Researchのソフトウェアエンジニア、クリシュナ・サプコタは言います。「教師モデルは高解像度画像で建物を特定することを学習し、生徒モデルにラベルを提供します。データセットを実際に作成する生徒モデルは、教師の出力から学習します。それにより、Sentinel-2の低解像度画像を受け取り、より高解像度のバージョンを推測できます。」
教師モデルは高解像度のトレーニングラベルを生徒モデルに提供し、生徒モデルは低解像度画像から建物の存在を判断します。
建物のフットプリントに必要な詳細を得るため、モデルは任意の予測に対して最大32フレームのSentinel-2画像を使用します。各フレームは、撮影間のわずかな時間差により少しずつ異なり、これが解像度を向上させるのに役立ちます—Pixel電話が複数のショットを使用してより鮮明な画像を作る方法と似ています。
元のデータセットが建物の正確なポリゴンアウトラインを提供していたのに対し、新しい時系列データセットは建物のフットプリントにラスターデータを使用します。また、人口密度の推定に重要な建物の高さを予測し、誤差はわずか1.5メートル、つまり1階未満です。
公式リリース前に、時系列データセットはウガンダの非営利団体Sunbird AIなどの信頼できるパートナーと共有されました。「ウガンダ人の約73%は電気がなく、Sunbird AIは元のデータベースを使用して政府がマイクログリッドやソーラーパネルの配置を決めるのを助けました」とオリビアは言います。「新しいデータセットでは、ジンジャやフォートポータルを見て、都市評議会が成長の早い地域を確認し、計画を調整するのに役立つビジュアルを作成しています。これは、両方のデータセットが人口とその変化を理解するためのより大きなツールキットの一部になり得ることを示しています。」
時系列データセットを生み出した同じ好奇心が、チームをさらなる改善に駆り立てています。
「私はガーナに住んでいて、私たちの仕事がもたらしている、そしてもたらし得る影響を見ています」とアブドゥライエは言います。「ここでは多くの場所がリソース不足に苦しんでおり、それが大きな影響を及ぼすデータギャップにつながっています。それを修正し、変化をもたらすチームの一員であることは本当の名誉です。」
関連記事
Metaが高度なLlamaツールでAIセキュリティを強化
Metaは、新たなLlamaセキュリティツールをリリースし、AI開発を強化し、新たな脅威から保護します。これらのアップグレードされたLlama AIモデルのセキュリティツールは、Metaの新しいリソースと組み合わされ、サイバーセキュリティチームがAIを防御に活用することを支援し、すべてのAIステークホルダーの安全性を高めることを目指します。Llamaモデルを使用する開発者は、MetaのLlama
NotebookLMがトップ出版物と専門家からの厳選ノートブックを公開
Googleは、AI駆動の研究およびノート作成ツールであるNotebookLMを強化し、包括的な知識ハブとして提供しています。月曜日、同社は著名な著者、出版物、研究者、非営利団体からの厳選されたノートブックコレクションを導入し、ユーザーが健康、旅行、ファイナンスなどの多様なトピックを探求できるようにしました。初期セットには、The Economist、The Atlantic、著名な教授、著者、さ
AlibabaがWan2.1-VACEを発表:オープンソースAIビデオソリューション
Alibabaは、ビデオ作成および編集プロセスを革新するオープンソースAIモデル、Wan2.1-VACEを発表しました。VACEは、AlibabaのWan2.1ビデオAIモデルファミリーの主要なコンポーネントであり、同社はこれが「業界初の多様なビデオ生成および編集タスクに対応する包括的なソリューションを提供するオープンソースモデル」だと主張しています。もしAlibabaがビデオ制作プロセスを効率化
コメント (27)
0/200
JustinHarris
2025年7月31日 10:41:20 JST
Super cool to see AI mapping buildings in the Global South! 😮 Makes me wonder how this could help urban planning or disaster response.
0
KennethJohnson
2025年7月22日 15:33:07 JST
This dataset sounds like a game-changer for urban planning! 😮 I wonder how accurate those AI-mapped footprints are compared to real-world buildings.
0
CarlHill
2025年4月19日 4:10:36 JST
新しいオープンビルディングデータセットのAI駆動開発はすごくクール!AIと衛星画像でグローバルサウスの建物のフットプリントをマッピングできるなんて驚きだ。でも、データが少し圧倒的すぎる。とはいえ、人口密度を理解するのに素晴らしいツールだよ!🌍📊
0
LarryMartin
2025年4月18日 1:08:18 JST
새로운 오픈 빌딩 데이터셋의 AI 기반 개발은 정말 멋져요! AI와 위성 이미지를 통해 글로벌 사우스의 건물 발자국을 매핑할 수 있다는 게 놀랍네요. 하지만 데이터가 조금 압도적이에요. 그래도 인구 밀도를 이해하는 데 좋은 도구예요! 🌍📊
0
StevenGreen
2025年4月16日 13:37:39 JST
El Desarrollo Impulsado por IA del Nuevo Conjunto de Datos de Edificios Abiertos es súper genial. Es increíble cómo la IA y las imágenes satelitales pueden mapear las huellas de los edificios en el Sur Global. Pero, los datos pueden ser un poco abrumadores. Aún así, es una gran herramienta para entender la densidad de población. 🌍📊
0
AlbertScott
2025年4月14日 20:26:14 JST
The AI-Driven Development of New Open Buildings Dataset is super cool! It's amazing how AI and satellite imagery can map building footprints in the Global South. But, the data can be a bit overwhelming. Still, it's a great tool for understanding population density! 🌍📊
0
2021年、Google Research Africaチームは、AIと高解像度衛星画像を使用してグローバルサウスの建物フットプリントをマッピングするオープンソースデータセット「Open Buildings」を開始しました。目的はシンプルで、発展途上国の人口と密度に関するデータの大きなギャップを埋めることでした。現在、3番目のバージョンが公開され、このデータセットはアフリカ、南および東南アジア、ラテンアメリカ、カリブ海にわたる5800万平方キロメートルで18億の建物のポリゴンを誇ります。
政府から国連、研究者、非営利団体まで多くの人々が、Open Buildingsを使用して人口規模と分布を把握しています。これにより、ワクチン接種キャンペーンや災害対応の計画が改善されました。また、Google Mapsにこれまでマッピングされていなかった数百万の建物を追加し、強化しました。
商用衛星画像プロバイダーは通常、収益を上げる地域に焦点を当て、世界の約40%、主にグローバルサウスを定期的な高解像度カバレッジから除外します。遠隔地や非公式の居住地は全くカバーされないこともあります。一方、欧州宇宙機関のSentinel-2衛星からのオープンソース画像は、5日ごとに全球を撮影しますが、建物検出には解像度が低すぎると考えられていました。
しかし、チームはそれが思ったほど大きな問題ではないかもしれないと考え、試してみました。
最初に、Sentinel-2の低解像度フレームをモデルに入力し、建物のポリゴンを描くように依頼しました。「難しかったですが、可能性を見ました」とアブドゥライエは言います。「そこで、モデルに建物のマスク—特定の地点に結びついたバイナリピクセルデータ—だけを提供するように指示しました。まずまずの結果で、『これはいける』と思いました。」
モデルの調整に1年を費やした後、先月、Open Buildings 2.5D Temporal Datasetを公開しました。これは2016年から2023年をカバーし、グローバルサウスの多くの地域で建物の存在と数の年次スナップショットを提供し、建物の高さも示します。これにより、開発、災害、その他の要因による都市の変化がわかります。ユーザーは地域を選び、年を切り替えて、カラフルな形状の表示で世界の成長と縮小を見ることができます。
「2050年までに、約25億人が都市に移住する可能性があり、そのほとんどがグローバルサウスです。このデータセットは、その成長に対処する政府や組織にとってゲームチェンジャーになる可能性があります」と、Google Researchのプロダクトマネージャー、オリビア・グラハムは言います。「都市が医療や教育などの必須サービスをどこに配置するか、または水やエネルギー供給のインフラをどこに構築するかを計画する場合、このデータセットはどの地域が急速に成長しているかを示します。」
では、チームはどのようにしてSentinel-2のぼやけた衛星画像を読み取り、自信を持って建物を検出するモデルを作ったのでしょうか?彼らはまず、画像を鮮明にすることから始めました。
「私たちは、教師-生徒モデル設定を使用して、低解像度画像を『超解像度化』し、建物のフットプリントを引き出しました」と、Google Researchのソフトウェアエンジニア、クリシュナ・サプコタは言います。「教師モデルは高解像度画像で建物を特定することを学習し、生徒モデルにラベルを提供します。データセットを実際に作成する生徒モデルは、教師の出力から学習します。それにより、Sentinel-2の低解像度画像を受け取り、より高解像度のバージョンを推測できます。」
建物のフットプリントに必要な詳細を得るため、モデルは任意の予測に対して最大32フレームのSentinel-2画像を使用します。各フレームは、撮影間のわずかな時間差により少しずつ異なり、これが解像度を向上させるのに役立ちます—Pixel電話が複数のショットを使用してより鮮明な画像を作る方法と似ています。
元のデータセットが建物の正確なポリゴンアウトラインを提供していたのに対し、新しい時系列データセットは建物のフットプリントにラスターデータを使用します。また、人口密度の推定に重要な建物の高さを予測し、誤差はわずか1.5メートル、つまり1階未満です。
公式リリース前に、時系列データセットはウガンダの非営利団体Sunbird AIなどの信頼できるパートナーと共有されました。「ウガンダ人の約73%は電気がなく、Sunbird AIは元のデータベースを使用して政府がマイクログリッドやソーラーパネルの配置を決めるのを助けました」とオリビアは言います。「新しいデータセットでは、ジンジャやフォートポータルを見て、都市評議会が成長の早い地域を確認し、計画を調整するのに役立つビジュアルを作成しています。これは、両方のデータセットが人口とその変化を理解するためのより大きなツールキットの一部になり得ることを示しています。」
時系列データセットを生み出した同じ好奇心が、チームをさらなる改善に駆り立てています。
「私はガーナに住んでいて、私たちの仕事がもたらしている、そしてもたらし得る影響を見ています」とアブドゥライエは言います。「ここでは多くの場所がリソース不足に苦しんでおり、それが大きな影響を及ぼすデータギャップにつながっています。それを修正し、変化をもたらすチームの一員であることは本当の名誉です。」


Super cool to see AI mapping buildings in the Global South! 😮 Makes me wonder how this could help urban planning or disaster response.




This dataset sounds like a game-changer for urban planning! 😮 I wonder how accurate those AI-mapped footprints are compared to real-world buildings.




新しいオープンビルディングデータセットのAI駆動開発はすごくクール!AIと衛星画像でグローバルサウスの建物のフットプリントをマッピングできるなんて驚きだ。でも、データが少し圧倒的すぎる。とはいえ、人口密度を理解するのに素晴らしいツールだよ!🌍📊




새로운 오픈 빌딩 데이터셋의 AI 기반 개발은 정말 멋져요! AI와 위성 이미지를 통해 글로벌 사우스의 건물 발자국을 매핑할 수 있다는 게 놀랍네요. 하지만 데이터가 조금 압도적이에요. 그래도 인구 밀도를 이해하는 데 좋은 도구예요! 🌍📊




El Desarrollo Impulsado por IA del Nuevo Conjunto de Datos de Edificios Abiertos es súper genial. Es increíble cómo la IA y las imágenes satelitales pueden mapear las huellas de los edificios en el Sur Global. Pero, los datos pueden ser un poco abrumadores. Aún así, es una gran herramienta para entender la densidad de población. 🌍📊




The AI-Driven Development of New Open Buildings Dataset is super cool! It's amazing how AI and satellite imagery can map building footprints in the Global South. But, the data can be a bit overwhelming. Still, it's a great tool for understanding population density! 🌍📊












