नई खुली इमारतों का एआई-चालित विकास डेटासेट अनावरण

2021 में, Google Research Africa टीम ने Open Buildings की शुरुआत की, जो एक ओपन-सोर्स डेटासेट है जो AI और उच्च-रिज़ॉल्यूशन सैटेलाइट इमेजरी का उपयोग करके ग्लोबल साउथ में भवनों के नक्शे को मैप करता है। उनका लक्ष्य काफी सरल था: विकासशील देशों में जनसंख्या और घनत्व के बारे में डेटा में एक बड़ा अंतर भरना। अब, तीसरे संस्करण के साथ, उनका डेटासेट अफ्रीका, दक्षिण और दक्षिणपूर्व एशिया, लैटिन अमेरिका और कैरिबियन में 58 मिलियन किमी² में फैले 1.8 बिलियन भवनों के लिए पॉलीगॉन प्रदान करता है।
सरकारों से लेकर संयुक्त राष्ट्र तक, और यहां तक कि शोधकर्ताओं और गैर-लाभकारी संगठनों ने, जनसंख्या के आकार और वितरण को समझने के लिए Open Buildings का उपयोग किया है। इससे उन्हें टीकाकरण अभियानों और आपदा प्रतिक्रिया जैसी चीजों के लिए बेहतर योजना बनाने में मदद मिली है। साथ ही, इसने Google Maps को और बेहतर बनाया है, जिसमें पहले मैप नहीं किए गए लाखों भवनों को जोड़ा गया है।
टीम, जो घाना में आधारित है लेकिन तेल अवीव और ज्यूरिख जैसे स्थानों में बिखरे हुए सदस्यों के साथ, इस परियोजना को और अधिक उपयोगी बनाने के मिशन पर है। "हम हमेशा हैकथॉन मोड में रहते हैं, नए विचारों को आजमाते हैं और चुनौतियों का सामना करते हैं," Google Research के प्रोग्राम मैनेजर अब्दुलाय डियाक कहते हैं। "मूल डेटासेट के साथ हम एक चीज नहीं कर पाए थे, वह थी समय के साथ क्षेत्रों में बदलाव दिखाना—यह स्थिर था। और यह कुछ ऐसा था जो हमारे साझेदार वास्तव में चाहते थे।"
वाणिज्यिक सैटेलाइट इमेज प्रदाता आमतौर पर उन क्षेत्रों पर ध्यान केंद्रित करते हैं जो लाभ कमाते हैं, जिससे विश्व का लगभग 40% हिस्सा, ज्यादातर ग्लोबल साउथ, नियमित उच्च-रिज़ॉल्यूशन कवरेज के बिना रह जाता है। कुछ दूरदराज के स्थान और अनौपचारिक बस्तियां बिल्कुल भी कवरेज नहीं पातीं। इस बीच, यूरोपीय अंतरिक्ष एजेंसी के Sentinel-2 सैटेलाइट से ओपन-सोर्स इमेजरी, जो हर पांच दिन में एक वैश्विक तस्वीर लेता है, को भवन पहचान के लिए बहुत कम रिज़ॉल्यूशन वाला माना जाता था।
लेकिन टीम ने सोचा कि यह उतनी बड़ी समस्या नहीं हो सकती जितना उन्होंने सोचा था, इसलिए उन्होंने इसे आजमाया।
पहले, उन्होंने Sentinel-2 से एक एकल कम-रिज़ॉल्यूशन फ्रेम को अपने मॉडल में डाला और उससे भवन पॉलीगॉन बनाने को कहा। "यह मुश्किल था, लेकिन हमें संभावना दिखी," अब्दुलाय कहते हैं। "इसलिए हमने मॉडल को बस भवन मास्क देने को कहा—विशिष्ट स्थानों से जुड़ा बाइनरी पिक्सेल डेटा। इसने ठीक काम किया, और हमने सोचा, 'हाय, हम यह कर सकते हैं।'"
एक साल तक मॉडल को ठीक करने के बाद, उन्होंने पिछले महीने Open Buildings 2.5D Temporal Dataset लॉन्च किया। यह 2016 से 2023 तक कवर करता है और ग्लोबल साउथ के अधिकांश हिस्सों में भवनों की मौजूदगी और गणना का वार्षिक स्नैपशॉट देता है, साथ ही भवनों की ऊंचाई भी। यह दिखाता है कि विकास, आपदाओं और अन्य कारकों के कारण शहर कैसे बदलते हैं। उपयोगकर्ता एक क्षेत्र चुन सकते हैं, वर्षों के बीच स्विच कर सकते हैं, और रंगीन आकृतियों के प्रदर्शन में दुनिया को बढ़ते और सिकुड़ते देख सकते हैं।
"2050 तक, लगभग 2.5 बिलियन और लोग शहरों में जा सकते हैं, ज्यादातर ग्लोबल साउथ में। यह डेटासेट सरकारों और संगठनों के लिए उस वृद्धि से निपटने में गेम-चेंजर हो सकता है," Google Research की प्रोडक्ट मैनेजर ओलिविया ग्राहम कहती हैं। "अगर कोई शहर यह योजना बना रहा है कि स्वास्थ्य और शिक्षा जैसी आवश्यक सेवाएं कहां रखनी हैं, या पानी और ऊर्जा आपूर्ति जैसी बुनियादी ढांचे कहां बनाना है, तो यह डेटासेट दिखाता है कि कौन से क्षेत्र तेजी से बढ़ रहे हैं।"
28 सितंबर, 2018 को, इंडोनेशिया के तट पर 7.4 तीव्रता का एक बड़ा भूकंप आया, जिसने सुलावेसी पर लगभग 1.5 मिलियन लोगों को प्रभावित करने वाली सुनामी को ट्रिगर किया। डेटासेट दिखाता है कि आपदा के बाद तट से निर्मित क्षेत्र कैसे पीछे हट गया। आप इसे हमारे इंटरैक्टिव Earth Engine ऐप में देख सकते हैं।
आप Open Buildings 2.5D Temporal Dataset डेमो में मिस्र के न्यू काहिरा के निर्माण को भी देख सकते हैं।
तो, टीम ने Sentinel-2 की धुंधली सैटेलाइट छवियों को पढ़ने और आत्मविश्वास के साथ भवनों का पता लगाने के लिए अपने मॉडल को कैसे तैयार किया? उन्होंने चीजों को तेज करने से शुरुआत की।
"हमने कम-रिज़ॉल्यूशन छवियों को 'सुपर-रिज़ॉल्व' करने और भवन फुटप्रिंट्स निकालने के लिए एक शिक्षक-छात्र मॉडल सेटअप का उपयोग किया," Google Research के सॉफ्टवेयर इंजीनियर कृष्णा सपकोटा कहते हैं। "शिक्षक मॉडल उच्च-रिज़ॉल्यूशन छवियों में भवनों को पहचानना सीखता है और छात्र मॉडल को लेबल देता है। छात्र मॉडल, जो वास्तव में डेटासेट बनाता है, शिक्षक के आउटपुट से सीखता है। फिर यह Sentinel-2 से कम-रिज़ॉल्यूशन छवियों को ले सकता है और अनुमान लगा सकता है कि उच्च-रिज़ॉल्यूशन संस्करण कैसा दिखेगा।"
शिक्षक मॉडल छात्र मॉडल को उच्च-रिज़ॉल्यूशन प्रशिक्षण लेबल देता है, जो फिर कम-रिज़ॉल्यूशन इमेजरी से भवनों की मौजूदगी का पता लगाता है।
भवन फुटप्रिंट्स के लिए आवश्यक विवरण प्राप्त करने के लिए, मॉडल किसी भी भविष्यवाणी के लिए एक स्थान की Sentinel-2 छवियों के 32 फ्रेम तक उपयोग करता है। प्रत्येक फ्रेम दूसरों से थोड़ा अलग होता है, कैप्चर के बीच छोटे समय अंतर के कारण, जो रिज़ॉल्यूशन को बढ़ाने में मदद करता है—कुछ हद तक जैसे Pixel फोन तेज छवियों के लिए कई शॉट्स का उपयोग करते हैं।
मूल डेटासेट के विपरीत, जो भवनों की सटीक पॉलीगॉनल रूपरेखा देता था, नया टेम्पोरल डेटासेट भवन फुटप्रिंट्स के लिए रास्टर डेटा का उपयोग करता है। यह जनसंख्या घनत्व का अनुमान लगाने के लिए महत्वपूर्ण भवनों की ऊंचाई भी अनुमानित करता है, जिसमें केवल 1.5 मीटर की त्रुटि होती है, जो एक मंजिल से कम है।
आधिकारिक रिलीज से पहले, टेम्पोरल डेटासेट को युगांडा के गैर-लाभकारी संगठन Sunbird AI जैसे विश्वसनीय साझेदारों के साथ साझा किया गया था। "लगभग 73% युगांडावासी बिजली के बिना हैं, और Sunbird AI ने हमारे मूल डेटाबेस का उपयोग सरकार को यह समझने में मदद करने के लिए किया कि माइक्रोग्रिड या सौर पैनल कहां रखने हैं," ओलिविया कहती हैं। "नए डेटासेट के साथ, वे जिन्जा और फोर्ट पोर्टल को देख रहे हैं, विज़ुअल्स बना रहे हैं जो शहर परिषदों को यह देखने में मदद करते हैं कि कहां तेजी से वृद्धि हो रही है और अपनी योजनाओं को समायोजित करते हैं। यह दिखाता है कि दोनों डेटासेट एक बड़े टूलकिट का हिस्सा हो सकते हैं जो जनसंख्या और इसके बदलाव को समझने में मदद करते हैं।"
टेम्पोरल डेटासेट को जन्म देने वाली वही जिज्ञासा टीम को इसे और बेहतर बनाने के लिए प्रेरित कर रही है।
"मैं घाना में रहता हूं और देखता हूं कि हमारा काम क्या प्रभाव डाल रहा है और डाल सकता है," अब्दुलाय कहते हैं। "यहां कई जगहों पर संसाधनों की कमी है, जिसके कारण डेटा में अंतर बड़े परिणामों के साथ आते हैं। उस अंतर को ठीक करने और बदलाव लाने के लिए काम करने वाली टीम का हिस्सा होना वास्तव में सम्मान की बात है।"
संबंधित लेख
मेटा ने उन्नत लामा उपकरणों के साथ AI सुरक्षा को बढ़ाया
मेटा ने AI विकास को मजबूत करने और उभरते खतरों से बचाव के लिए नए लामा सुरक्षा उपकरण जारी किए हैं।ये उन्नत लामा AI मॉडल सुरक्षा उपकरण मेटा के नए संसाधनों के साथ जोड़े गए हैं, ताकि साइबरसुरक्षा टीमों को
NotebookLM ने शीर्ष प्रकाशनों और विशेषज्ञों से संग्रहित नोटबुक्स का अनावरण किया
Google अपने AI-चालित अनुसंधान और नोट-टेकिंग टूल, NotebookLM को एक व्यापक ज्ञान केंद्र के रूप में बढ़ा रहा है। सोमवार को, कंपनी ने प्रमुख लेखकों, प्रकाशनों, शोधकर्ताओं और गैर-लाभकारी संगठनों से संग्रहि
अलीबाबा ने Wan2.1-VACE का अनावरण किया: ओपन-सोर्स AI वीडियो समाधान
अलीबाबा ने Wan2.1-VACE पेश किया है, जो एक ओपन-सोर्स AI मॉडल है और वीडियो निर्माण और संपादन प्रक्रियाओं को बदलने के लिए तैयार है।VACE अलीबाबा के Wan2.1 वीडियो AI मॉडल परिवार का एक प्रमुख घटक है, कंपनी
सूचना (27)
0/200
JustinHarris
31 जुलाई 2025 7:11:20 पूर्वाह्न IST
Super cool to see AI mapping buildings in the Global South! 😮 Makes me wonder how this could help urban planning or disaster response.
0
KennethJohnson
22 जुलाई 2025 12:03:07 अपराह्न IST
This dataset sounds like a game-changer for urban planning! 😮 I wonder how accurate those AI-mapped footprints are compared to real-world buildings.
0
CarlHill
19 अप्रैल 2025 12:40:36 पूर्वाह्न IST
新しいオープンビルディングデータセットのAI駆動開発はすごくクール!AIと衛星画像でグローバルサウスの建物のフットプリントをマッピングできるなんて驚きだ。でも、データが少し圧倒的すぎる。とはいえ、人口密度を理解するのに素晴らしいツールだよ!🌍📊
0
LarryMartin
17 अप्रैल 2025 9:38:18 अपराह्न IST
새로운 오픈 빌딩 데이터셋의 AI 기반 개발은 정말 멋져요! AI와 위성 이미지를 통해 글로벌 사우스의 건물 발자국을 매핑할 수 있다는 게 놀랍네요. 하지만 데이터가 조금 압도적이에요. 그래도 인구 밀도를 이해하는 데 좋은 도구예요! 🌍📊
0
StevenGreen
16 अप्रैल 2025 10:07:39 पूर्वाह्न IST
El Desarrollo Impulsado por IA del Nuevo Conjunto de Datos de Edificios Abiertos es súper genial. Es increíble cómo la IA y las imágenes satelitales pueden mapear las huellas de los edificios en el Sur Global. Pero, los datos pueden ser un poco abrumadores. Aún así, es una gran herramienta para entender la densidad de población. 🌍📊
0
AlbertScott
14 अप्रैल 2025 4:56:14 अपराह्न IST
The AI-Driven Development of New Open Buildings Dataset is super cool! It's amazing how AI and satellite imagery can map building footprints in the Global South. But, the data can be a bit overwhelming. Still, it's a great tool for understanding population density! 🌍📊
0
2021 में, Google Research Africa टीम ने Open Buildings की शुरुआत की, जो एक ओपन-सोर्स डेटासेट है जो AI और उच्च-रिज़ॉल्यूशन सैटेलाइट इमेजरी का उपयोग करके ग्लोबल साउथ में भवनों के नक्शे को मैप करता है। उनका लक्ष्य काफी सरल था: विकासशील देशों में जनसंख्या और घनत्व के बारे में डेटा में एक बड़ा अंतर भरना। अब, तीसरे संस्करण के साथ, उनका डेटासेट अफ्रीका, दक्षिण और दक्षिणपूर्व एशिया, लैटिन अमेरिका और कैरिबियन में 58 मिलियन किमी² में फैले 1.8 बिलियन भवनों के लिए पॉलीगॉन प्रदान करता है।
सरकारों से लेकर संयुक्त राष्ट्र तक, और यहां तक कि शोधकर्ताओं और गैर-लाभकारी संगठनों ने, जनसंख्या के आकार और वितरण को समझने के लिए Open Buildings का उपयोग किया है। इससे उन्हें टीकाकरण अभियानों और आपदा प्रतिक्रिया जैसी चीजों के लिए बेहतर योजना बनाने में मदद मिली है। साथ ही, इसने Google Maps को और बेहतर बनाया है, जिसमें पहले मैप नहीं किए गए लाखों भवनों को जोड़ा गया है।
वाणिज्यिक सैटेलाइट इमेज प्रदाता आमतौर पर उन क्षेत्रों पर ध्यान केंद्रित करते हैं जो लाभ कमाते हैं, जिससे विश्व का लगभग 40% हिस्सा, ज्यादातर ग्लोबल साउथ, नियमित उच्च-रिज़ॉल्यूशन कवरेज के बिना रह जाता है। कुछ दूरदराज के स्थान और अनौपचारिक बस्तियां बिल्कुल भी कवरेज नहीं पातीं। इस बीच, यूरोपीय अंतरिक्ष एजेंसी के Sentinel-2 सैटेलाइट से ओपन-सोर्स इमेजरी, जो हर पांच दिन में एक वैश्विक तस्वीर लेता है, को भवन पहचान के लिए बहुत कम रिज़ॉल्यूशन वाला माना जाता था।
लेकिन टीम ने सोचा कि यह उतनी बड़ी समस्या नहीं हो सकती जितना उन्होंने सोचा था, इसलिए उन्होंने इसे आजमाया।
पहले, उन्होंने Sentinel-2 से एक एकल कम-रिज़ॉल्यूशन फ्रेम को अपने मॉडल में डाला और उससे भवन पॉलीगॉन बनाने को कहा। "यह मुश्किल था, लेकिन हमें संभावना दिखी," अब्दुलाय कहते हैं। "इसलिए हमने मॉडल को बस भवन मास्क देने को कहा—विशिष्ट स्थानों से जुड़ा बाइनरी पिक्सेल डेटा। इसने ठीक काम किया, और हमने सोचा, 'हाय, हम यह कर सकते हैं।'"
एक साल तक मॉडल को ठीक करने के बाद, उन्होंने पिछले महीने Open Buildings 2.5D Temporal Dataset लॉन्च किया। यह 2016 से 2023 तक कवर करता है और ग्लोबल साउथ के अधिकांश हिस्सों में भवनों की मौजूदगी और गणना का वार्षिक स्नैपशॉट देता है, साथ ही भवनों की ऊंचाई भी। यह दिखाता है कि विकास, आपदाओं और अन्य कारकों के कारण शहर कैसे बदलते हैं। उपयोगकर्ता एक क्षेत्र चुन सकते हैं, वर्षों के बीच स्विच कर सकते हैं, और रंगीन आकृतियों के प्रदर्शन में दुनिया को बढ़ते और सिकुड़ते देख सकते हैं।
"2050 तक, लगभग 2.5 बिलियन और लोग शहरों में जा सकते हैं, ज्यादातर ग्लोबल साउथ में। यह डेटासेट सरकारों और संगठनों के लिए उस वृद्धि से निपटने में गेम-चेंजर हो सकता है," Google Research की प्रोडक्ट मैनेजर ओलिविया ग्राहम कहती हैं। "अगर कोई शहर यह योजना बना रहा है कि स्वास्थ्य और शिक्षा जैसी आवश्यक सेवाएं कहां रखनी हैं, या पानी और ऊर्जा आपूर्ति जैसी बुनियादी ढांचे कहां बनाना है, तो यह डेटासेट दिखाता है कि कौन से क्षेत्र तेजी से बढ़ रहे हैं।"
तो, टीम ने Sentinel-2 की धुंधली सैटेलाइट छवियों को पढ़ने और आत्मविश्वास के साथ भवनों का पता लगाने के लिए अपने मॉडल को कैसे तैयार किया? उन्होंने चीजों को तेज करने से शुरुआत की।
"हमने कम-रिज़ॉल्यूशन छवियों को 'सुपर-रिज़ॉल्व' करने और भवन फुटप्रिंट्स निकालने के लिए एक शिक्षक-छात्र मॉडल सेटअप का उपयोग किया," Google Research के सॉफ्टवेयर इंजीनियर कृष्णा सपकोटा कहते हैं। "शिक्षक मॉडल उच्च-रिज़ॉल्यूशन छवियों में भवनों को पहचानना सीखता है और छात्र मॉडल को लेबल देता है। छात्र मॉडल, जो वास्तव में डेटासेट बनाता है, शिक्षक के आउटपुट से सीखता है। फिर यह Sentinel-2 से कम-रिज़ॉल्यूशन छवियों को ले सकता है और अनुमान लगा सकता है कि उच्च-रिज़ॉल्यूशन संस्करण कैसा दिखेगा।"
भवन फुटप्रिंट्स के लिए आवश्यक विवरण प्राप्त करने के लिए, मॉडल किसी भी भविष्यवाणी के लिए एक स्थान की Sentinel-2 छवियों के 32 फ्रेम तक उपयोग करता है। प्रत्येक फ्रेम दूसरों से थोड़ा अलग होता है, कैप्चर के बीच छोटे समय अंतर के कारण, जो रिज़ॉल्यूशन को बढ़ाने में मदद करता है—कुछ हद तक जैसे Pixel फोन तेज छवियों के लिए कई शॉट्स का उपयोग करते हैं।
मूल डेटासेट के विपरीत, जो भवनों की सटीक पॉलीगॉनल रूपरेखा देता था, नया टेम्पोरल डेटासेट भवन फुटप्रिंट्स के लिए रास्टर डेटा का उपयोग करता है। यह जनसंख्या घनत्व का अनुमान लगाने के लिए महत्वपूर्ण भवनों की ऊंचाई भी अनुमानित करता है, जिसमें केवल 1.5 मीटर की त्रुटि होती है, जो एक मंजिल से कम है।
आधिकारिक रिलीज से पहले, टेम्पोरल डेटासेट को युगांडा के गैर-लाभकारी संगठन Sunbird AI जैसे विश्वसनीय साझेदारों के साथ साझा किया गया था। "लगभग 73% युगांडावासी बिजली के बिना हैं, और Sunbird AI ने हमारे मूल डेटाबेस का उपयोग सरकार को यह समझने में मदद करने के लिए किया कि माइक्रोग्रिड या सौर पैनल कहां रखने हैं," ओलिविया कहती हैं। "नए डेटासेट के साथ, वे जिन्जा और फोर्ट पोर्टल को देख रहे हैं, विज़ुअल्स बना रहे हैं जो शहर परिषदों को यह देखने में मदद करते हैं कि कहां तेजी से वृद्धि हो रही है और अपनी योजनाओं को समायोजित करते हैं। यह दिखाता है कि दोनों डेटासेट एक बड़े टूलकिट का हिस्सा हो सकते हैं जो जनसंख्या और इसके बदलाव को समझने में मदद करते हैं।"
टेम्पोरल डेटासेट को जन्म देने वाली वही जिज्ञासा टीम को इसे और बेहतर बनाने के लिए प्रेरित कर रही है।
"मैं घाना में रहता हूं और देखता हूं कि हमारा काम क्या प्रभाव डाल रहा है और डाल सकता है," अब्दुलाय कहते हैं। "यहां कई जगहों पर संसाधनों की कमी है, जिसके कारण डेटा में अंतर बड़े परिणामों के साथ आते हैं। उस अंतर को ठीक करने और बदलाव लाने के लिए काम करने वाली टीम का हिस्सा होना वास्तव में सम्मान की बात है।"


Super cool to see AI mapping buildings in the Global South! 😮 Makes me wonder how this could help urban planning or disaster response.




This dataset sounds like a game-changer for urban planning! 😮 I wonder how accurate those AI-mapped footprints are compared to real-world buildings.




新しいオープンビルディングデータセットのAI駆動開発はすごくクール!AIと衛星画像でグローバルサウスの建物のフットプリントをマッピングできるなんて驚きだ。でも、データが少し圧倒的すぎる。とはいえ、人口密度を理解するのに素晴らしいツールだよ!🌍📊




새로운 오픈 빌딩 데이터셋의 AI 기반 개발은 정말 멋져요! AI와 위성 이미지를 통해 글로벌 사우스의 건물 발자국을 매핑할 수 있다는 게 놀랍네요. 하지만 데이터가 조금 압도적이에요. 그래도 인구 밀도를 이해하는 데 좋은 도구예요! 🌍📊




El Desarrollo Impulsado por IA del Nuevo Conjunto de Datos de Edificios Abiertos es súper genial. Es increíble cómo la IA y las imágenes satelitales pueden mapear las huellas de los edificios en el Sur Global. Pero, los datos pueden ser un poco abrumadores. Aún así, es una gran herramienta para entender la densidad de población. 🌍📊




The AI-Driven Development of New Open Buildings Dataset is super cool! It's amazing how AI and satellite imagery can map building footprints in the Global South. But, the data can be a bit overwhelming. Still, it's a great tool for understanding population density! 🌍📊












