소식 휴대 전화 데이터 및 기계 학습으로 '숨겨진 방문'을 발견

휴대 전화 데이터 및 기계 학습으로 '숨겨진 방문'을 발견

2025년 4월 22일
JustinScott
0

연구원들이 전화 통화에만 의존하지 않고 국가 간 운동을 어떻게 추적하는지 궁금했다면, 중국과 미국의 연구원들의 흥미로운 연구는 통찰력을 제공합니다. 그들의 공동 작업은 기계 학습을 사용하여 우리가 만든 '숨겨진 방문'을 밝히기 위해, 우리는 휴대폰을 충분히 사용하지 않기 때문에 표준 통신 데이터에 나타나지 않는 여행을 발견합니다.

Sparse Call Detail Record Data **에서 숨겨진 방문을 식별하는 **라는 제목의 연구는 홍콩 대학교의 Zhan Zhao와 보스턴의 노스 이스턴 대학교의 Haris N. Koutsopoulos와 MIT의 Jinhua Zhao와 함께 주도합니다. 그들의 목표? 모바일 데이터, SMS 및 음성 통화와 같은 모바일 연결 레코드를 활용하기 위해, 매우 활발한 사용자에서 전화를 덜 자주 사용하는 사람들의 이동 패턴을 모델링하고 예측하는 것까지.

통화 세부 사항 레코드 (CD) 데이터에서 트립 정보를 추출하기위한 대략적인 도식. 출처 : https://arxiv.org/pdf/2106.12885.pdf * 통화 세부 사항 레코드 (CD) 데이터에서 여행 정보를 추출하기위한 대략적인 도식.* 출처 : https://arxiv.org/pdf/2106.12885.pdf

팀은 잠재적 인 프라이버시가 자신의 업무를 제기하는 것에 대한 우려를 인정하지만, 그들의 목표는 개별 여행을 확대하는 대신 운동 패턴에 대한보다 일반적인 이해를 얻는 것임을 강조합니다. 또한 그러한 연구의 중추 인 CDR (Call Detail Record) 데이터는 그 제한 사항이 있다고 지적합니다. 휴대폰 타워에 비해 사용자의 위치가 변경되어 공간 분해능이 낮고 '포지셔닝 노이즈'에 취약합니다. 그러나 그들은이 부정확성이 실제로 개인 정보 보호 역할을한다고 주장합니다.

** '우리의 연구의 목표 적용은 여행 감지 및 OD 추정치 \ [\*\]이며, 개별 수준이 아닌 집계 수준에서 수행됩니다. 개발 된 모델은 데이터 전송이 필요없이 통신 사업자의 데이터베이스 서버에 직접 배포 될 수 있습니다. 또한 소셜 미디어 또는 신용 카드 거래 데이터와 같은 다른 형태의 빅 데이터와 비교할 때 CDR 데이터는 개인 정보 보호 측면에서 상대적으로 덜 방해받습니다. 또한 현지화 오류는 정확한 사용자 위치를 숨기고 개인 정보 보존의 다른 계층을 제공하는 데 도움이됩니다. '**

경과 시간 간격 (ETI)

반드시 스마트 폰이 아닌 휴대 전화를 사용하고있을 때는 위치를 정확히 지적하기위한 도구로서 CDR 데이터의 한계가 명확 해집니다. 우리가 전화를 걸거나받지 않는 여정의 기간 인 ETI (ETI)는 운동을 추적하는 데 중요한 마커입니다. 이러한 '침묵'간격은 그리드에서 일시적으로 사라질 수 있습니다.

연구원들은 이러한 격차가 A> B 여정을 이해하려고 노력하는 분석 시스템을 어떻게 방해하는지 강조합니다. 데이터의 희소성은 '관찰되지 않은 여행'을 숨길 수 있습니다. 그들의 새로운 방법은 ETI의 시공간적 맥락을 분석하고 '사용자의 개별 특성'을 고려함으로써 이것을 다룹니다.

데이터 세트

핵심 교육 세트를 구축하기 위해 연구원들은 6 백만 인구가있는 중국 도시의 주요 셀룰러 서비스 운영자의 데이터를 사용했습니다. 이 데이터 세트에는 2013 년 11 월 3 백만 명의 사용자로부터 20 억 개가 넘는 휴대 전화 거래가 포함되어 있으며, 음성 통화 및 데이터 액세스 레코드에만 중점을 두었습니다. 특히, 그들은 SMS 데이터를 포함하지 않았으며, 이는 희소 데이터를 다루는 데 어려움을 겪었습니다.

데이터에는 암호화 된 고유 ID, LAC (Location Area Code), 타임 스탬프, LAC에 연결된 휴대 전화 ID가 포함되어 트랜잭션과 관련된 특정 휴대 전화 타워를 식별하고 발신/수신 통화 또는 데이터 사용 여부를 나타내는 이벤트 ID가 포함되었습니다.

숨겨진 방문을 식별하기위한 프로세스 트리. *숨겨진 방문 식별을위한 프로세스 트리.*

이 정보는 셀 타워 작동 데이터베이스와 교차 참조하여 연구원들이 각 통신 이벤트와 관련된 타워의 경도 및 위도 좌표를 정확히 찾아 낼 수있었습니다. 그들은 데이터 세트 내에서 9000 개의 셀 타워를 식별했습니다.

연구원들은 전형적인 여행 패턴과 일치하는 아침과 오후 에이 기록이 절정에 이르기 때문에 통화 기록을 기반으로 한 여행 목적지를 정확하게 추측하는 데 어려움이 있다고 언급했습니다. 전화 통화가 여행을 앞두고 심지어 트리거 될 수도 있으므로 대상 추정을 기울일 수 있습니다.

하루 동안 모바일 사용 패턴. *하루 동안 모바일 사용 패턴.*

메시징 앱과 같은 사용자가 시작한 데이터 사용으로도 비슷한 문제가 발생합니다. 그러나이 숨겨진 움직임을 식별하는 데 도움이되는 새로운 메시지 또는 GPS 및 텔레미트 측정을 포함한 기타 데이터를위한 API의 체계적인 폴링과 같은 '자동화 된'데이터 사용량입니다.

처리

연구원들은 로지스틱 회귀, 지원 벡터 머신 (SVM), 랜덤 포리스트 및 그라디언트 촉진 앙상블 접근법을 포함 하여이 문제를 해결하기 위해 다양한 머신 러닝 분류기를 사용했습니다. 이들은 기본 설정과 함께 Scikit-Learn을 사용하여 파이썬으로 구현되었습니다.

이 중에서도 로지스틱 회귀는 가장 해석 가능한 모델 매개 변수를 제공했습니다. 또한이 팀은 ETI가 더 길어서 아침에 더 높은 발병률로 숨겨진 방문 가능성이 높아 졌다는 것을 발견했습니다. 반대로, 사용자의 CDR 데이터가 많은 수의 목적지 나 웨이 포인트를 명확하게 보여 주면 숨겨진 방문 가능성이 더 낮았습니다. 이 발견은 연구의 핵심 원칙을 뒷받침합니다. 가장 활발한 사용자는 덜 활동적인 사용자의 행동을 추론 할 수있는 운동의 상세한 그림을 제공합니다.

결론적으로, 연구원들은 그들의 접근 방식이 스마트 카드 데이터 및 지리적으로 배치 된 소셜 미디어 정보와 같은 다른 유형의 대중 교통 데이터에 적용될 수 있다고 제안합니다.

이 연구는 Energy Foundation China와 China Sustainable Transportation Center의 자금 지원으로 지원되었습니다.

* \* 원산지-증명*

관련 기사
'저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다 '저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다 미시간 주립 대학의 연구원들은 이미지 인식 시스템의 정확성을 강화하는 고귀한 원인을 위해 합성 얼굴을 사용하는 혁신적인 방법을 제시했습니다. Deepfakes 현상에 기여하는 대신, 이러한 합성면은 실제에서 발견되는 결점을 모방하도록 설계되었습니다.
Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다 Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다 AI 보상 모델에서 DeepSeek의 획기적인 발전 : AI 추론 및 대응 강화 중국 AI 스타트 업 DeepSeek는 Tsinghua University와 협력하여 AI 연구에서 중요한 이정표를 달성했습니다. AI 보상 모델에 대한 혁신적인 접근 방식은 AI 시스템이 학습하는 방식에 혁명을 약속합니다.
DeepCoder는 14B 오픈 모델로 높은 코딩 효율을 달성합니다 DeepCoder는 14B 오픈 모델로 높은 코딩 효율을 달성합니다 DeepCoder-14B 소개 : Openai의 O3-MINI와 같은 최상위 독점 모델을 갖춘 획기적인 코딩 모델 인 AI와 Agentica의 팀은 Open-Source Coding Models의 새로운 프론티어를 소개했습니다. 이 흥미로운 개발은 FO를 기반으로합니다
의견 (10)
0/200
BrianWalker 2025년 4월 23일 오전 10시 37분 3초 GMT

This study on tracking hidden visits with cell phone data and ML is mind-blowing 🤯 It's cool to see how researchers from different countries are teaming up to uncover these patterns. But it's also a bit creepy knowing our movements can be tracked so easily. Still, super interesting and definitely worth a read! 📚

BenHernández 2025년 4월 23일 오전 10시 37분 3초 GMT

携帯電話データと機械学習を使って隠れた訪問を追跡するこの研究は驚きです🤯 異なる国の研究者が協力してこれらのパターンを明らかにしているのはクールです。でも、私たちの移動がこんなに簡単に追跡されるのはちょっと気味悪いです。でも、とても興味深くて読む価値があります!📚

HarryLewis 2025년 4월 23일 오전 10시 37분 3초 GMT

휴대전화 데이터와 머신러닝으로 숨겨진 방문을 추적하는 이 연구는 정말 놀랍네요 🤯 다른 나라의 연구자들이 협력해서 이런 패턴을 밝히는 건 멋지죠. 하지만 우리의 이동이 이렇게 쉽게 추적된다는 게 조금 섬뜩하기도 해요. 그래도 정말 흥미롭고 읽을 가치가 있어요! 📚

JasonMartin 2025년 4월 23일 오전 10시 37분 3초 GMT

Este estudo sobre o rastreamento de visitas ocultas com dados de celular e ML é impressionante 🤯 É legal ver como pesquisadores de diferentes países estão colaborando para descobrir esses padrões. Mas também é um pouco assustador saber que nossos movimentos podem ser rastreados tão facilmente. Ainda assim, muito interessante e vale a pena ler! 📚

RaymondRodriguez 2025년 4월 23일 오전 10시 37분 3초 GMT

Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚

SamuelClark 2025년 4월 23일 오전 7시 52분 14초 GMT

This study on 'hidden visits' using cell phone data and machine learning is mind-blowing! It's fascinating how they can track movements so accurately. But it's also a bit creepy, isn't it? 🤔📱

OR