옵션
뉴스
새로운 오픈 빌딩 데이터 세트의 AI 중심 개발

새로운 오픈 빌딩 데이터 세트의 AI 중심 개발

2025년 4월 10일
164

새로운 오픈 빌딩 데이터 세트의 AI 중심 개발

2021년, Google Research Africa 팀은 AI와 고해상도 위성 이미지를 사용하여 글로벌 사우스 지역의 건물 위치를 매핑하는 오픈소스 데이터셋인 Open Buildings를 시작했습니다. 그들의 목표는 매우 간단했습니다: 개발도상국의 인구와 밀도에 대한 데이터의 큰 공백을 채우는 것이었습니다. 이제 세 번째 버전이 나왔으며, 이 데이터셋은 아프리카, 남아시아 및 동남아시아, 라틴아메리카, 카리브해에 걸쳐 5,800만 km²에 달하는 지역에서 무려 18억 개의 건물에 대한 폴리곤을 자랑합니다.

정부부터 UN, 연구자, 비영리 단체에 이르기까지 많은 사람들이 Open Buildings를 활용하여 인구 규모와 분포를 파악하고 있습니다. 이는 백신 캠페인이나 재난 대응과 같은 계획을 더 잘 세우는 데 도움이 되었습니다. 또한, 이전에 매핑되지 않았던 수백만 개의 건물을 Google Maps에 추가하여 이를 강화했습니다.

가나에 기반을 두고 있지만 텔아비브와 취리히 같은 곳에 흩어져 있는 팀원들로 구성된 이 팀은 프로젝트를 더욱 유용하게 만들기 위한 임무를 수행해 왔습니다. "우리는 항상 해커톤 모드에 있으며, 새로운 아이디어를 시도하고 도전 과제를 해결합니다,"라고 Google Research 프로그램 매니저 Abdoulaye Diack은 말합니다. "원래 데이터셋으로는 지역이 시간에 따라 어떻게 변하는지 보여줄 수 없었습니다—그것은 정적이었습니다. 그리고 그것은 우리 파트너들이 정말로 원했던 것이었습니다."

상업용 위성 이미지 제공업체는 일반적으로 수익을 내는 지역에 초점을 맞추며, 글로벌 사우스의 약 40% 정도는 정기적인 고해상도 커버리지를 받지 못합니다. 일부 외딴 지역과 비공식 정착지는 전혀 커버리지를 받지 못합니다. 한편, 유럽 우주국(European Space Agency)의 Sentinel-2 위성에서 제공하는 오픈소스 이미지는 5일마다 전 세계를 촬영하지만, 건물 탐지에 너무 낮은 해상도로 여겨졌습니다.

하지만 팀은 그것이 생각만큼 큰 문제가 아닐 수도 있다고 판단하고 시도해 보았습니다.

먼저, 그들은 Sentinel-2의 단일 저해상도 프레임을 모델에 입력하여 건물 폴리곤을 그리도록 요청했습니다. "그것은 어려웠지만 가능성을 보았습니다,"라고 Abdoulaye는 말합니다. "그래서 우리는 모델에게 특정 위치에 묶인 바이너리 픽셀 데이터인 건물 마스크만 제공하라고 했습니다. 모델은 괜찮은 성능을 보였고, 우리는 '이거 할 수 있겠구나'라고 생각했습니다."

모델을 1년 동안 조정한 후, 그들은 지난달 Open Buildings 2.5D Temporal Dataset을 출시했습니다. 이 데이터셋은 2016년부터 2023년까지를 다루며, 글로벌 사우스의 많은 지역에 걸쳐 건물 존재 여부와 수를 연도별로 스냅샷으로 제공하며, 건물 높이도 포함합니다. 이를 통해 개발, 재난, 기타 요인으로 인해 도시가 어떻게 변하는지 보여줍니다. 사용자는 지역을 선택하고 연도를 넘기며 다채로운 형태의 디스플레이에서 세계가 커지고 줄어드는 모습을 볼 수 있습니다.

"2050년까지 약 25억 명이 추가로 도시에 거주하게 될 것이며, 대부분은 글로벌 사우스 지역입니다. 이 데이터셋은 그 성장을 다루는 정부와 조직에게 게임 체인저가 될 수 있습니다,"라고 Google Research 제품 매니저 Olivia Graham은 말합니다. "만약 도시가 의료나 교육 같은 필수 서비스를 어디에 배치할지, 또는 물과 에너지 공급과 같은 인프라를 어디에 건설할지 계획한다면, 이 데이터셋은 어떤 지역이 빠르게 성장하고 있는지 보여줍니다."

2018년 9월 28일, 인도네시아 해안에서 발생한 7.4 규모의 대지진이 술라웨시에서 약 150만 명에게 영향을 미친 쓰나미를 촉발했습니다. 데이터셋은 재난 이후 해안에서 건축 지역이 어떻게 후퇴했는지 보여줍니다. 이를 우리의 인터랙티브 Earth Engine 앱에서 확인할 수 있습니다.

이집트 뉴카이로의 건설 모습도 Open Buildings 2.5D Temporal Dataset 데모에서 확인할 수 있습니다.

그렇다면, 팀은 어떻게 Sentinel-2의 흐릿한 위성 이미지를 읽고 건물을 자신 있게 탐지하도록 모델을 만들었을까요? 그들은 먼저 선명도를 높이는 것부터 시작했습니다.

"우리는 저해상도 이미지를 '초고해상도'로 만들고 건물 위치를 추출하기 위해 교사-학생 모델 설정을 사용했습니다,"라고 Google Research 소프트웨어 엔지니어 Krishna Sapkota는 말합니다. "교사 모델은 고해상도 이미지에서 건물을 식별하는 법을 배우고 학생 모델에 레이블을 제공합니다. 데이터셋을 실제로 생성하는 학생 모델은 교사의 출력에서 학습합니다. 그런 다음 Sentinel-2의 저해상도 이미지를 받아 더 높은 해상도의 버전이 어떤 모습일지 추측할 수 있습니다."

교사 모델은 고해상도 훈련 레이블을 학생 모델에 제공하며, 학생 모델은 저해상도 이미지에서 건물 존재 여부를 파악합니다.

건물 위치에 필요한 세부 정보를 얻기 위해 모델은 예측을 위해 한 장소에 대한 최대 32프레임의 Sentinel-2 이미지를 사용합니다. 각 프레임은 캡처 간의 미세한 시간 차이로 인해 약간씩 다르며, 이는 해상도를 높이는 데 도움을 줍니다—まるで Pixel 폰이 더 선명한 이미지를 위해 여러 장의 샷을 사용하는 방식과 비슷합니다.

원래 데이터셋이 건물의 정확한 폴리곤 윤곽을 제공했던 것과 달리, 새로운 시간적 데이터셋은 건물 위치에 래스터 데이터를 사용합니다. 또한 인구 밀도를 추정하는 데 중요한 건물 높이를 예측하며, 오차는 1.5미터, 즉 한 층 미만에 불과합니다.

공식 출시 전에 시간적 데이터셋은 우간다의 비영리 단체 Sunbird AI와 같은 신뢰할 수 있는 파트너들과 공유되었습니다. "우간다인의 약 73%는 전기를 사용하지 않으며, Sunbird AI는 우리의 원래 데이터베이스를 사용하여 정부가 마이크로그리드나 태양광 패널을 배치할 위치를 파악하도록 도왔습니다,"라고 Olivia는 말합니다. "새로운 데이터셋으로 그들은 진자(Jinja)와 포트 포털(Fort Portal)을 살펴보며, 시의회에서 성장 속도가 빠른 지역을 시각화하고 계획을 조정할 수 있도록 돕는 시각 자료를 만들고 있습니다. 이는 두 데이터셋이 인구와 그 변화 방식을 이해하는 더 큰 툴킷의 일부가 될 수 있음을 보여줍니다."

시간적 데이터셋을 만들게 한 호기심은 팀이 이를 계속 개선하도록 밀어주고 있습니다.

"저는 가나에 살며 우리 작업이 미치는 영향과 미칠 수 있는 영향을 보고 있습니다,"라고 Abdoulaye는 말합니다. "여기 많은 곳은 자원 부족으로 인해 데이터 공백이 발생하며, 이는 큰 결과를 초래합니다. 이를 해결하고 변화를 만들기 위해 노력하는 팀의 일원이 되는 것은 정말 영광입니다."

관련 기사
Meta, 고급 Llama 도구로 AI 보안 강화 Meta, 고급 Llama 도구로 AI 보안 강화 Meta는 AI 개발을 강화하고 새로운 위협으로부터 보호하기 위해 새로운 Llama 보안 도구를 출시했습니다.이러한 업그레이드된 Llama AI 모델 보안 도구는 Meta의 새로운 리소스와 함께 제공되어 사이버 보안 팀이 AI를 방어에 활용할 수 있도록 지원하며, 모든 AI 이해관계자의 안전을 강화하는 것을 목표로 합니다.Llama 모델을 사용하는 개발자는
NotebookLM, 최고 출판사 및 전문가로부터 선별된 노트북 공개 NotebookLM, 최고 출판사 및 전문가로부터 선별된 노트북 공개 구글은 AI 기반 연구 및 메모 도구인 NotebookLM을 강화하여 포괄적인 지식 허브로 제공합니다. 월요일, 회사는 저명한 저자, 출판사, 연구자, 비영리 단체로부터 선별된 노트북 컬렉션을 소개하며, 사용자가 건강, 여행, 금융 등 다양한 주제를 탐색할 수 있도록 했습니다.초기 세트는 The Economist, The Atlantic, 유명 교수, 저자
Alibaba, Wan2.1-VACE 공개: 오픈소스 AI 비디오 솔루션 Alibaba, Wan2.1-VACE 공개: 오픈소스 AI 비디오 솔루션 Alibaba가 Wan2.1-VACE를 공개, 비디오 제작 및 편집 프로세스를 혁신할 오픈소스 AI 모델.VACE는 Alibaba의 Wan2.1 비디오 AI 모델 패밀리의 핵심 구성 요소로, 회사는 이를 업계 최초의 다양한 비디오 생성 및 편집 작업을 위한 포괄적 솔루션을 제공하는 오픈소스 모델이라고 주장.Alibaba가 비디오 제작 프로세스를 간소화하고
의견 (27)
0/200
JustinHarris
JustinHarris 2025년 7월 31일 오전 10시 41분 20초 GMT+09:00

Super cool to see AI mapping buildings in the Global South! 😮 Makes me wonder how this could help urban planning or disaster response.

KennethJohnson
KennethJohnson 2025년 7월 22일 오후 3시 33분 7초 GMT+09:00

This dataset sounds like a game-changer for urban planning! 😮 I wonder how accurate those AI-mapped footprints are compared to real-world buildings.

CarlHill
CarlHill 2025년 4월 19일 오전 4시 10분 36초 GMT+09:00

新しいオープンビルディングデータセットのAI駆動開発はすごくクール!AIと衛星画像でグローバルサウスの建物のフットプリントをマッピングできるなんて驚きだ。でも、データが少し圧倒的すぎる。とはいえ、人口密度を理解するのに素晴らしいツールだよ!🌍📊

LarryMartin
LarryMartin 2025년 4월 18일 오전 1시 8분 18초 GMT+09:00

새로운 오픈 빌딩 데이터셋의 AI 기반 개발은 정말 멋져요! AI와 위성 이미지를 통해 글로벌 사우스의 건물 발자국을 매핑할 수 있다는 게 놀랍네요. 하지만 데이터가 조금 압도적이에요. 그래도 인구 밀도를 이해하는 데 좋은 도구예요! 🌍📊

StevenGreen
StevenGreen 2025년 4월 16일 오후 1시 37분 39초 GMT+09:00

El Desarrollo Impulsado por IA del Nuevo Conjunto de Datos de Edificios Abiertos es súper genial. Es increíble cómo la IA y las imágenes satelitales pueden mapear las huellas de los edificios en el Sur Global. Pero, los datos pueden ser un poco abrumadores. Aún así, es una gran herramienta para entender la densidad de población. 🌍📊

AlbertScott
AlbertScott 2025년 4월 14일 오후 8시 26분 14초 GMT+09:00

The AI-Driven Development of New Open Buildings Dataset is super cool! It's amazing how AI and satellite imagery can map building footprints in the Global South. But, the data can be a bit overwhelming. Still, it's a great tool for understanding population density! 🌍📊

위로 돌아갑니다
OR