lựa chọn
Trang chủ
Tin tức
Phát triển AI-Driven của Bộ dữ liệu các tòa nhà mở mới được tiết lộ

Phát triển AI-Driven của Bộ dữ liệu các tòa nhà mở mới được tiết lộ

Ngày 10 tháng 4 năm 2025
164

Phát triển AI-Driven của Bộ dữ liệu các tòa nhà mở mới được tiết lộ

Vào năm 2021, đội ngũ Google Research Africa đã khởi động Open Buildings, một tập dữ liệu mã nguồn mở lập bản đồ dấu chân các tòa nhà trên khắp khu vực Nam Bán Cầu bằng AI và hình ảnh vệ tinh độ phân giải cao. Mục tiêu của họ khá đơn giản: lấp đầy khoảng trống lớn trong dữ liệu về dân số và mật độ ở các quốc gia đang phát triển. Giờ đây, với phiên bản thứ ba được phát hành, tập dữ liệu này tự hào có các đa giác cho tới 1,8 tỷ tòa nhà trải rộng trên 58 triệu km² ở Châu Phi, Nam và Đông Nam Á, Mỹ Latinh và Caribe.

Rất nhiều người, từ chính phủ đến Liên Hợp Quốc, và thậm chí cả các nhà nghiên cứu và tổ chức phi lợi nhuận, đã sử dụng Open Buildings để nắm bắt quy mô và phân bố dân số. Điều này đã giúp họ lập kế hoạch tốt hơn cho các chiến dịch tiêm chủng và ứng phó thảm họa. Ngoài ra, nó thậm chí còn cải thiện Google Maps bằng cách bổ sung hàng triệu tòa nhà chưa từng được lập bản đồ trước đây.

Đội ngũ, đặt trụ sở tại Ghana nhưng có thành viên rải rác ở các nơi như Tel Aviv và Zurich, đã không ngừng nỗ lực để khiến dự án trở nên hữu ích hơn. “Chúng tôi luôn ở trạng thái hackathon, thử nghiệm những ý tưởng mới và giải quyết các thách thức,” quản lý chương trình Google Research Abdoulaye Diack nói. “Một điều chúng tôi không thể làm với tập dữ liệu ban đầu là thể hiện cách các khu vực thay đổi theo thời gian—nó chỉ là tĩnh. Và đó là điều mà các đối tác của chúng tôi thực sự mong muốn.”

Các nhà cung cấp hình ảnh vệ tinh thương mại thường tập trung vào các khu vực mang lại lợi nhuận, để lại khoảng 40% thế giới, chủ yếu là Nam Bán Cầu, không có độ phủ độ phân giải cao thường xuyên. Một số điểm xa xôi và các khu định cư không chính thức hoàn toàn không được phủ sóng. Trong khi đó, hình ảnh mã nguồn mở từ vệ tinh Sentinel-2 của Cơ quan Vũ trụ Châu Âu, chụp ảnh toàn cầu cứ mỗi năm ngày, được cho là có độ phân giải quá thấp để phát hiện tòa nhà.

Nhưng đội ngũ nghĩ rằng điều đó có thể không phải là vấn đề lớn như họ tưởng, nên họ đã thử sức.

Đầu tiên, họ đưa một khung hình độ phân giải thấp từ Sentinel-2 vào mô hình của mình và yêu cầu nó vẽ các đa giác tòa nhà. “Nó rất khó khăn, nhưng chúng tôi thấy tiềm năng,” Abdoulaye nói. “Vì vậy, chúng tôi bảo mô hình chỉ cần cung cấp cho chúng tôi các mặt nạ tòa nhà—dữ liệu pixel nhị phân gắn với các điểm cụ thể. Nó đã làm khá tốt, và chúng tôi nghĩ, ‘Này, chúng ta có thể làm được điều này.’”

Sau một năm tinh chỉnh mô hình, họ đã phát hành Tập dữ liệu Tạm thời Open Buildings 2.5D vào tháng trước. Nó bao gồm từ năm 2016 đến 2023 và cung cấp ảnh chụp hàng năm về sự hiện diện và số lượng tòa nhà trên khắp phần lớn Nam Bán Cầu, cùng với chiều cao tòa nhà. Điều này cho thấy cách các thành phố thay đổi do phát triển, thảm họa và các yếu tố khác. Người dùng có thể chọn một khu vực, lật qua các năm và xem thế giới phát triển và thu hẹp trong một màn hình đầy màu sắc của các hình dạng.

“Đến năm 2050, khoảng 2,5 tỷ người nữa có thể chuyển đến các thành phố, chủ yếu ở Nam Bán Cầu. Tập dữ liệu này có thể là một yếu tố thay đổi cuộc chơi cho các chính phủ và tổ chức đối phó với sự tăng trưởng đó,” quản lý sản phẩm Google Research Olivia Graham nói. “Nếu một thành phố đang lên kế hoạch đặt các dịch vụ thiết yếu như y tế và giáo dục, hoặc xây dựng cơ sở hạ tầng như cấp nước và năng lượng, tập dữ liệu này cho thấy khu vực nào đang phát triển nhanh.”

Vào ngày 28 tháng 9 năm 2018, một trận động đất mạnh 7,4 độ richter ngoài khơi bờ biển Indonesia đã gây ra sóng thần, ảnh hưởng đến khoảng 1,5 triệu người trên đảo Sulawesi. Tập dữ liệu cho thấy khu vực xây dựng đã rút lui khỏi bờ biển sau thảm họa. Bạn có thể xem nó trong ứng dụng Earth Engine tương tác của chúng tôi.

Bạn cũng có thể thấy sự xây dựng của New Cairo, Ai Cập, trong bản demo Tập dữ liệu Tạm thời Open Buildings 2.5D.

Vậy, đội ngũ đã làm thế nào để mô hình của họ đọc được những hình ảnh vệ tinh mờ từ Sentinel-2 và tự tin phát hiện các tòa nhà? Họ bắt đầu bằng cách làm sắc nét mọi thứ.

“Chúng tôi đã sử dụng thiết lập mô hình thầy-trò để vừa ‘siêu phân giải’ các hình ảnh độ phân giải thấp vừa rút ra dấu chân tòa nhà,” kỹ sư phần mềm Google Research Krishna Sapkota nói. “Mô hình thầy học cách phát hiện các tòa nhà trong hình ảnh độ phân giải cao và cung cấp nhãn cho mô hình trò. Mô hình trò, thực sự tạo ra tập dữ liệu, học từ đầu ra của mô hình thầy. Sau đó, nó có thể lấy hình ảnh độ phân giải thấp từ Sentinel-2 và đoán xem phiên bản độ phân giải cao hơn sẽ trông như thế nào.”

Mô hình thầy cung cấp nhãn huấn luyện độ phân giải cao cho mô hình trò, sau đó mô hình trò tìm ra sự hiện diện của tòa nhà từ hình ảnh độ phân giải thấp.

Để có được chi tiết cần thiết cho dấu chân tòa nhà, mô hình sử dụng tới 32 khung hình ảnh Sentinel-2 của một điểm cho bất kỳ dự đoán nào. Mỗi khung hình hơi khác nhau, nhờ vào khoảng cách thời gian nhỏ giữa các lần chụp, giúp tăng cường độ phân giải—giống như cách điện thoại Pixel sử dụng nhiều lần chụp để có hình ảnh sắc nét hơn.

Không giống như tập dữ liệu ban đầu, cung cấp các đường viền đa giác chính xác của các tòa nhà, tập dữ liệu tạm thời mới sử dụng dữ liệu raster cho dấu chân tòa nhà. Nó cũng dự đoán chiều cao tòa nhà, quan trọng để ước tính mật độ dân số, với sai số chỉ 1,5 mét, tức là dưới một tầng.

Trước khi phát hành chính thức, tập dữ liệu tạm thời đã được chia sẻ với các đối tác đáng tin cậy như tổ chức phi lợi nhuận Uganda Sunbird AI. “Khoảng 73% người Uganda không có điện, và Sunbird AI đã sử dụng cơ sở dữ liệu ban đầu của chúng tôi để giúp chính phủ xác định nơi đặt các lưới điện nhỏ hoặc tấm pin mặt trời,” Olivia nói. “Với tập dữ liệu mới, họ đang xem xét Jinja và Fort Portal, tạo ra các hình ảnh trực quan giúp hội đồng thành phố thấy nơi nào đang phát triển nhanh và điều chỉnh kế hoạch của họ. Nó cho thấy cả hai tập dữ liệu có thể là một phần của bộ công cụ lớn hơn để hiểu về dân số và cách nó đang thay đổi.”

Sự tò mò đã dẫn đến tập dữ liệu tạm thời đang thúc đẩy đội ngũ tiếp tục cải thiện nó.

“Tôi sống ở Ghana và thấy được tác động mà công việc của chúng tôi đang có và có thể có,” Abdoulaye nói. “Nhiều nơi ở đây gặp khó khăn với tài nguyên, dẫn đến các khoảng trống dữ liệu với hậu quả lớn. Là một phần của đội ngũ đang nỗ lực khắc phục điều đó và tạo ra sự khác biệt là một vinh dự thực sự.”

Bài viết liên quan
Meta Tăng Cường Bảo Mật AI với Công Cụ Llama Nâng Cao Meta Tăng Cường Bảo Mật AI với Công Cụ Llama Nâng Cao Meta đã phát hành các công cụ bảo mật Llama mới để thúc đẩy phát triển AI và bảo vệ chống lại các mối đe dọa mới nổi.Các công cụ bảo mật mô hình AI Llama nâng cấp này được kết hợp với các tài nguyên m
NotebookLM Ra Mắt Bộ Sưu Tập Ghi Chép Được Chọn Lọc từ Các Ấn Phẩm và Chuyên Gia Hàng Đầu NotebookLM Ra Mắt Bộ Sưu Tập Ghi Chép Được Chọn Lọc từ Các Ấn Phẩm và Chuyên Gia Hàng Đầu Google đang nâng cấp công cụ nghiên cứu và ghi chú dựa trên AI, NotebookLM, để trở thành một trung tâm tri thức toàn diện. Vào thứ Hai, công ty đã giới thiệu một bộ sưu tập ghi chép được chọn lọc từ c
Alibaba Công Bố Wan2.1-VACE: Giải Pháp Video AI Mã Nguồn Mở Alibaba Công Bố Wan2.1-VACE: Giải Pháp Video AI Mã Nguồn Mở Alibaba đã giới thiệu Wan2.1-VACE, một mô hình AI mã nguồn mở được thiết kế để thay đổi quy trình tạo và chỉnh sửa video.VACE là thành phần cốt lõi của gia đình mô hình video AI Wan2.1 của Alibaba, vớ
Nhận xét (27)
0/200
JustinHarris
JustinHarris 08:41:20 GMT+07:00 Ngày 31 tháng 7 năm 2025

Super cool to see AI mapping buildings in the Global South! 😮 Makes me wonder how this could help urban planning or disaster response.

KennethJohnson
KennethJohnson 13:33:07 GMT+07:00 Ngày 22 tháng 7 năm 2025

This dataset sounds like a game-changer for urban planning! 😮 I wonder how accurate those AI-mapped footprints are compared to real-world buildings.

CarlHill
CarlHill 02:10:36 GMT+07:00 Ngày 19 tháng 4 năm 2025

新しいオープンビルディングデータセットのAI駆動開発はすごくクール!AIと衛星画像でグローバルサウスの建物のフットプリントをマッピングできるなんて驚きだ。でも、データが少し圧倒的すぎる。とはいえ、人口密度を理解するのに素晴らしいツールだよ!🌍📊

LarryMartin
LarryMartin 23:08:18 GMT+07:00 Ngày 17 tháng 4 năm 2025

새로운 오픈 빌딩 데이터셋의 AI 기반 개발은 정말 멋져요! AI와 위성 이미지를 통해 글로벌 사우스의 건물 발자국을 매핑할 수 있다는 게 놀랍네요. 하지만 데이터가 조금 압도적이에요. 그래도 인구 밀도를 이해하는 데 좋은 도구예요! 🌍📊

StevenGreen
StevenGreen 11:37:39 GMT+07:00 Ngày 16 tháng 4 năm 2025

El Desarrollo Impulsado por IA del Nuevo Conjunto de Datos de Edificios Abiertos es súper genial. Es increíble cómo la IA y las imágenes satelitales pueden mapear las huellas de los edificios en el Sur Global. Pero, los datos pueden ser un poco abrumadores. Aún así, es una gran herramienta para entender la densidad de población. 🌍📊

AlbertScott
AlbertScott 18:26:14 GMT+07:00 Ngày 14 tháng 4 năm 2025

The AI-Driven Development of New Open Buildings Dataset is super cool! It's amazing how AI and satellite imagery can map building footprints in the Global South. But, the data can be a bit overwhelming. Still, it's a great tool for understanding population density! 🌍📊

Quay lại đầu
OR