विकल्प
घर
समाचार
सेल फोन डेटा और मशीन लर्निंग के साथ हमारी 'छिपी हुई यात्राओं' को उजागर करना

सेल फोन डेटा और मशीन लर्निंग के साथ हमारी 'छिपी हुई यात्राओं' को उजागर करना

23 अप्रैल 2025
26

यदि आपने कभी सोचा है कि कैसे शोधकर्ता किसी देश में हमारे आंदोलनों को पूरी तरह से फोन कॉल पर भरोसा किए बिना ट्रैक करते हैं, तो चीन और संयुक्त राज्य अमेरिका के शोधकर्ताओं द्वारा एक आकर्षक अध्ययन कुछ अंतर्दृष्टि प्रदान करता है। उनके सहयोगी कार्य 'छिपे हुए यात्राओं' को उजागर करने के लिए मशीन लर्निंग के उपयोग में शामिल हैं - वे यात्राएं जो मानक दूरसंचार डेटा में नहीं दिखाई देती हैं क्योंकि हम अपने फोन का पर्याप्त उपयोग नहीं कर रहे हैं।

अध्ययन, जिसका शीर्षक है ** स्पार्स कॉल डिटेल रिकॉर्ड डेटा ** से छिपी हुई यात्राओं की पहचान, हांगकांग विश्वविद्यालय से ज़हान झाओ द्वारा, बोस्टन में नॉर्थईस्टर्न यूनिवर्सिटी से हरिस एन। कॉट्सोपोलोस और एमआईटी से जिन्हुआ झाओ के साथ। उनके लक्ष्य? मोबाइल कनेक्टिविटी रिकॉर्ड का लाभ उठाने के लिए - जैसे कि मोबाइल डेटा, एसएमएस और वॉयस कॉल - अत्यधिक सक्रिय उपयोगकर्ताओं से लेकर मॉडल और उन लोगों के आंदोलन पैटर्न की भविष्यवाणी करने के लिए जो अपने फोन का कम बार उपयोग करते हैं।

कॉल डिटेल रिकॉर्ड (सीडी) डेटा से यात्रा की जानकारी निकालने के लिए एक मोटा योजनाबद्ध। स्रोत: https://arxiv.org/pdf/2106.12885.pdf * कॉल डिटेल रिकॉर्ड (सीडी) डेटा से यात्रा की जानकारी निकालने के लिए एक मोटा योजनाबद्ध।* स्रोत: https://arxiv.org/pdf/2106.12885.pdf

जबकि टीम स्वीकार करती है कि संभावित गोपनीयता की चिंता उनके काम को बढ़ाती है, वे इस बात पर जोर देते हैं कि उनका उद्देश्य व्यक्तिगत यात्रा पर ज़ूम करने के बजाय आंदोलन पैटर्न की अधिक सामान्यीकृत समझ हासिल करना है। वे यह भी बताते हैं कि कॉल डिटेल रिकॉर्ड (CDR) डेटा, जो इस तरह के अध्ययनों की रीढ़ है, इसकी सीमाएं हैं। यह अक्सर स्थानिक संकल्प में कम होता है और सेल फोन टावरों के सापेक्ष उपयोगकर्ता की बदलती स्थिति के कारण 'स्थिति शोर' के लिए अतिसंवेदनशील होता है। हालांकि, वे तर्क देते हैं कि यह अशुद्धि वास्तव में एक गोपनीयता सुरक्षा के रूप में कार्य करती है:

** 'हमारे अध्ययन का लक्ष्य अनुप्रयोग यात्रा का पता लगाने और OD अनुमान \ [\*\] है, जो कि कुल स्तर पर किया जाता है, व्यक्तिगत स्तर पर नहीं। विकसित मॉडल को सीधे डेटा ट्रांसफर की आवश्यकता के बिना, टेलीकॉम वाहक के डेटाबेस सर्वर पर सीधे तैनात किया जा सकता है। इसके अलावा, बड़े डेटा के अन्य रूपों की तुलना में, जैसे सोशल मीडिया या क्रेडिट कार्ड लेनदेन डेटा, सीडीआर डेटा व्यक्तिगत गोपनीयता के मामले में अपेक्षाकृत कम घुसपैठ है। इसके अलावा, इसकी स्थानीयकरण त्रुटि सटीक उपयोगकर्ता स्थानों को मुखौटा करने में मदद करती है, जो गोपनीयता संरक्षण की एक और परत प्रदान करती है। '**

समाप्त समय अंतराल (ईटीआई)

जब हम अपने मोबाइल फोन के साथ आगे बढ़ते हैं, तो जरूरी नहीं कि स्मार्टफोन हो, हमारे स्थान को इंगित करने के लिए एक उपकरण के रूप में सीडीआर डेटा की सीमाएं स्पष्ट हो जाती हैं। बीते समय अंतराल (ईटीआई), एक यात्रा के दौरान वे अवधि जहां हम कॉल नहीं करते हैं या प्राप्त नहीं करते हैं, हमारे आंदोलनों को ट्रैक करने के लिए महत्वपूर्ण मार्कर हैं। 'साइलेंस' के ये अंतराल हमें ग्रिड से अस्थायी रूप से गायब कर सकते हैं।

शोधकर्ता इस बात पर प्रकाश डालते हैं कि कैसे ये अंतराल विश्लेषणात्मक प्रणालियों में हस्तक्षेप करते हैं, जो ए> बी यात्रा की समझ बनाने की कोशिश कर रहे हैं। डेटा की विरूपता एक 'अनियंत्रित यात्रा' को छिपा सकती है। उनकी नई विधि ईटीआई के स्पैटियोटेम्पोरल संदर्भ का विश्लेषण करके और 'उपयोगकर्ता की व्यक्तिगत विशेषताओं' पर विचार करके इसका सामना करती है।

डेटासेट

अपने मुख्य प्रशिक्षण सेट का निर्माण करने के लिए, शोधकर्ताओं ने 6 मिलियन की आबादी वाले एक चीनी शहर में एक प्रमुख सेलुलर सेवा ऑपरेटर से डेटा का उपयोग किया। इस डेटासेट में नवंबर 2013 में तीन मिलियन उपयोगकर्ताओं से दो बिलियन मोबाइल फोन लेनदेन शामिल थे, जो केवल वॉयस कॉल और डेटा एक्सेस रिकॉर्ड पर ध्यान केंद्रित करते थे। विशेष रूप से, उन्होंने एसएमएस डेटा को शामिल नहीं किया, जो विरल डेटा से निपटने की चुनौती में जोड़ा गया।

डेटा में एक एन्क्रिप्टेड अद्वितीय आईडी, एक स्थान क्षेत्र कोड (LAC), एक टाइमस्टैम्प, एक सेल फोन आईडी शामिल है जो लेनदेन में शामिल विशिष्ट सेल फोन टॉवर की पहचान करने के लिए LAC से जुड़ी थी, और एक इवेंट आईडी यह दर्शाता है कि यह एक आउटगोइंग/इनकमिंग कॉल या डेटा उपयोग था।

छिपी हुई यात्राओं की पहचान के लिए प्रक्रिया पेड़। *छिपी हुई यात्राओं की पहचान के लिए प्रक्रिया ट्री।*

यह जानकारी एक सेल टॉवर ऑपरेशन डेटाबेस के साथ क्रॉस-रेफर की गई थी, जिससे शोधकर्ताओं को प्रत्येक संचार घटना से जुड़े टॉवर के देशांतर और अक्षांश निर्देशांक को इंगित करने में सक्षम बनाया गया था। उन्होंने डेटासेट के भीतर 9000 सेल टावरों की पहचान की।

शोधकर्ताओं ने पूरी तरह से कॉल रिकॉर्ड के आधार पर यात्रा स्थलों का सही अनुमान लगाने में कठिनाई का उल्लेख किया, क्योंकि ये रिकॉर्ड सुबह और दोपहर में होते हैं, जो विशिष्ट यात्रा पैटर्न के साथ संरेखित होता है। चूंकि फोन कॉल एक यात्रा से पहले हो सकते हैं और इसे ट्रिगर भी कर सकते हैं, इसलिए यह गंतव्य अनुमान को तिरछा कर सकता है।

एक दिन के दौरान मोबाइल उपयोग पैटर्न। *एक दिन के दौरान मोबाइल उपयोग पैटर्न।*

इसी तरह की चुनौतियां उपयोगकर्ता द्वारा शुरू किए गए डेटा उपयोग के साथ उत्पन्न होती हैं, जैसे कि मैसेजिंग ऐप्स। हालांकि, यह 'स्वचालित' डेटा उपयोग है - जैसे कि नए संदेशों या अन्य डेटा के लिए एपीआई के व्यवस्थित मतदान, जिसमें जीपीएस और टेलीमेट्री सहित ऐप्स शामिल हैं - जो इन छिपे हुए आंदोलनों की पहचान करने में मदद करता है।

प्रसंस्करण

शोधकर्ताओं ने इस समस्या से निपटने के लिए विभिन्न प्रकार की मशीन लर्निंग क्लासिफायर को नियोजित किया, जिसमें लॉजिस्टिक रिग्रेशन, सपोर्ट वेक्टर मशीन (एसवीएम), रैंडम फॉरेस्ट, और एक ढाल को बढ़ावा देने वाले कलाकारों की टुकड़ी शामिल हैं। इन्हें डिफ़ॉल्ट सेटिंग्स के साथ Scikit-Learn का उपयोग करके पायथन में लागू किया गया था।

इनमें से, लॉजिस्टिक रिग्रेशन ने सबसे अधिक व्याख्यात्मक मॉडल पैरामीटर प्रदान किए। टीम ने यह भी पाया कि अब ईटीआई ने सुबह में एक उच्च घटना के साथ एक छिपी हुई यात्रा की संभावना को बढ़ाया। इसके विपरीत, जब किसी उपयोगकर्ता के सीडीआर डेटा ने स्पष्ट रूप से उच्च संख्या में गंतव्यों या वेपॉइंट्स को दिखाया, तो एक छिपी हुई यात्रा की संभावना कम थी। यह खोज उनके शोध के मुख्य सिद्धांत का समर्थन करती है - जो कि सबसे सक्रिय उपयोगकर्ता उनके आंदोलनों की एक विस्तृत तस्वीर प्रदान करते हैं, जिसमें से कम सक्रिय उपयोगकर्ताओं के व्यवहार का अनुमान लगाया जा सकता है।

उनके निष्कर्ष में, शोधकर्ताओं का सुझाव है कि उनके दृष्टिकोण को अन्य प्रकार के पारगमन डेटा पर लागू किया जा सकता है, जैसे कि स्मार्ट कार्ड डेटा और भू-स्थित सोशल मीडिया जानकारी।

अनुसंधान को एनर्जी फाउंडेशन चीन और चीन सस्टेनेबल ट्रांसपोर्टेशन सेंटर से फंडिंग द्वारा समर्थित किया गया था।

* \* मूल-द्वेष*

संबंधित लेख
專注於實惠增強現實的真實對焦系統 專注於實惠增強現實的真實對焦系統 顛覆基於投影的增強現實技術來自著名機構電機電子工程師學會(IEEE)的研究人員在基於投影的增強現實領域取得了突破性的進展。他們的解決方案?配備了電控可變焦鏡片(ETL)的特殊眼鏡,這些鏡片模擬人類眼睛自然感知深度的方式。這種創新的方法解決了使投影系統在受控環境中真正實用的主要障礙。想像一下走進一個房間,其中投影的3D物體看起來就像周圍的家具一樣真實。這就是該
我們如何使用AI來幫助城市應對極端熱量 我們如何使用AI來幫助城市應對極端熱量 看起來2024年可能會打破迄今為止最熱的一年的記錄,超過了2023年。這種趨勢對生活在城市熱島的人們來說尤為艱難,這些景點是在混凝土和瀝青浸泡太陽射線,然後散發出熱量的城市中的那些景點。這些區域可以溫暖
“退化”合成面可能會增強面部識別技術 “退化”合成面可能會增強面部識別技術 密歇根州立大學的研究人員提出了一種創新的方式,將合成面孔用於崇高的原因 - 增強圖像識別系統的準確性。這些合成面無代替導致深層現象的貢獻
सूचना (15)
BrianWalker
BrianWalker 23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

This study on tracking hidden visits with cell phone data and ML is mind-blowing 🤯 It's cool to see how researchers from different countries are teaming up to uncover these patterns. But it's also a bit creepy knowing our movements can be tracked so easily. Still, super interesting and definitely worth a read! 📚

BenHernández
BenHernández 23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

携帯電話データと機械学習を使って隠れた訪問を追跡するこの研究は驚きです🤯 異なる国の研究者が協力してこれらのパターンを明らかにしているのはクールです。でも、私たちの移動がこんなに簡単に追跡されるのはちょっと気味悪いです。でも、とても興味深くて読む価値があります!📚

HarryLewis
HarryLewis 23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

휴대전화 데이터와 머신러닝으로 숨겨진 방문을 추적하는 이 연구는 정말 놀랍네요 🤯 다른 나라의 연구자들이 협력해서 이런 패턴을 밝히는 건 멋지죠. 하지만 우리의 이동이 이렇게 쉽게 추적된다는 게 조금 섬뜩하기도 해요. 그래도 정말 흥미롭고 읽을 가치가 있어요! 📚

JasonMartin
JasonMartin 23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

Este estudo sobre o rastreamento de visitas ocultas com dados de celular e ML é impressionante 🤯 É legal ver como pesquisadores de diferentes países estão colaborando para descobrir esses padrões. Mas também é um pouco assustador saber que nossos movimentos podem ser rastreados tão facilmente. Ainda assim, muito interessante e vale a pena ler! 📚

RaymondRodriguez
RaymondRodriguez 23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚

SamuelClark
SamuelClark 23 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

This study on 'hidden visits' using cell phone data and machine learning is mind-blowing! It's fascinating how they can track movements so accurately. But it's also a bit creepy, isn't it? 🤔📱

शीर्ष समाचार
Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया दक्षिण कोरिया स्थानीय दुकानों में दीपसेक ऐप डाउनलोड करता है Adobe 10 विशिष्ट AI एजेंटों का अनावरण करता है: उनके व्यावसायिक अनुप्रयोगों की खोज करें चैट की ऊर्जा का उपयोग अपेक्षा से कम है Openai का O3 मॉडल संभावित रूप से अधिक महंगा है जो शुरू में विचार की तुलना में संचालित होता है नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है
अधिक
शीर्ष पर वापस
OR