携帯電話のデータと機械学習で「隠された訪問」を明らかにする
2025年4月22日
JustinScott
0
研究者が電話だけに頼らずに国全体の私たちの動きをどのように追跡したか疑問に思ったことがあるなら、中国と米国の研究者による魅力的な研究が洞察を提供します。彼らの共同作業は、私たちが行う「隠された訪問」を明らかにするために機械学習の使用を掘り下げます。私たちは携帯電話を十分に使用していないため、標準の通信データには表示されない旅行です。
**スパースコールの詳細レコードデータからの隠された訪問を識別する**というタイトルの研究は、香港大学のZhan Zhaoが、ボストンの北東大学のハリスN. Koutsopoulos、MITのJinhua Zhaoとともに先頭に立っています。彼らの目標?モバイルデータ、SMS、音声通話など、モバイル接続レコードを活用するために、非常にアクティブなユーザーから、携帯電話を使用する頻度ではない人の移動パターンをモデル化および予測します。
*コール詳細レコード(CD)データからトリップ情報を抽出するための大まかな回路図。*出典:https://arxiv.org/pdf/2106.12885.pdf
チームは、潜在的なプライバシーが彼らの仕事を引き起こす懸念を認めていますが、彼らの目的は、個々の旅にズームインするのではなく、運動パターンのより一般化された理解を得ることであることを強調しています。彼らはまた、そのような研究のバックボーンであるCall Detail Record(CDR)データにはその制限があることを指摘しています。多くの場合、空間分解能が低く、携帯電話の塔と比較してユーザーの位置が変化しているため、「位置付けノイズ」を受けやすくなります。しかし、彼らは、この不正確さは実際にはプライバシーセーフガードとして機能すると主張しています。
** '私たちの研究のターゲットアプリケーションは、旅行の検出とOD推定\ [\*\]であり、個々のレベルではなく集計レベルで行われます。開発されたモデルは、データ転送を必要とせずに、通信担体のデータベースサーバーに直接展開できます。さらに、ソーシャルメディアやクレジットカードトランザクションデータなど、他の形式のビッグデータと比較して、CDRデータは個人的なプライバシーの点では比較的邪魔になりません。さらに、そのローカリゼーションエラーは、正確なユーザーの場所をマスクするのに役立ち、プライバシー保存の別の層を提供します。 '**
経過時間間隔(ETI)
必ずしもスマートフォンではなく、携帯電話を使用して移動しているとき、私たちの場所を特定するためのツールとしてのCDRデータの制限が明らかになります。経過時間間隔(ETIS)、通話をしたり受信したりしない旅の期間は、動きを追跡するための重要なマーカーです。これらの「沈黙」の間隔は、グリッドから一時的に消滅する可能性があります。
研究者は、これらのギャップがA> Bの旅を理解しようとする分析システムとどのように干渉するかを強調しています。データのスパースは、「観察されていない旅行」を隠している可能性があります。彼らの新しい方法は、ETISの時空間的コンテキストを分析し、「ユーザーの個々の特性」を検討することにより、これに取り組みます。
データセット
コアトレーニングセットを構築するために、研究者は人口600万人の中国の都市の主要な携帯電話サービスオペレーターのデータを使用しました。このデータセットには、2013年11月の300万人のユーザーからの20億以上の携帯電話トランザクションが含まれており、音声通話とデータアクセスレコードのみに焦点を当てています。特に、SMSデータは含まれておらず、まばらなデータを処理するという課題に追加されました。
データには、暗号化された一意のID、ロケーションエーカーコード(LAC)、タイムスタンプ、LACにリンクされた携帯電話IDがトランザクションに関与する特定の携帯電話タワーを識別し、発信/着信コールまたはデータの使用かを示すイベントIDが含まれていました。
*隠された訪問の識別のためにツリーを処理します。*
この情報は、セルタワーの操作データベースで相互参照され、研究者が各通信イベントに関連するタワーの経度と緯度座標を特定できるようにしました。彼らは、データセット内の9000のセルタワーを特定しました。
研究者たちは、これらの記録が朝と午後にピークに達するため、コールレコードのみに基づいて旅行の目的地を正確に推測することが難しいことに注目しました。電話は旅に先行する可能性があり、それをトリガーすることさえあるかもしれないので、これは目的地の推定を歪める可能性があります。
*1日の間にモバイル使用パターン。*
メッセージングアプリなど、ユーザーが開始したデータ使用量でも同様の課題が生じます。ただし、これらの隠された動きを識別するのに役立つ、新しいメッセージやGPSやテレメトリを含む他のデータのAPIの体系的なポーリングなど、「自動化された」データの使用法などです。
処理
研究者は、ロジスティック回帰、サポートベクターマシン(SVM)、ランダムフォレスト、勾配ブーストアンサンブルアプローチなど、この問題に取り組むために、さまざまな機械学習分類器を採用しました。これらは、デフォルト設定でScikit-Learnを使用してPythonで実装されました。
これらのうち、ロジスティック回帰は、最も解釈可能なモデルパラメーターを提供しました。チームはまた、ETIが長くなると隠された訪問が起こる可能性を高め、朝の発生率が高いことを発見しました。逆に、ユーザーのCDRデータが多くの目的地またはウェイポイントを明確に示した場合、隠された訪問の可能性は低くなりました。この発見は、最もアクティブなユーザーが自分の動きの詳細な画像を提供し、そこからアクティブなユーザーの動作を推測できるという研究の中心的な原則をサポートしています。
彼らの結論として、研究者は、彼らのアプローチが、スマートカードデータや地理的なソーシャルメディア情報など、他のタイプの輸送データに適用できることを示唆しています。
この研究は、エネルギー財団中国と中国の持続可能な交通センターからの資金提供によって支援されました。
* \*起源の捨て*
関連記事
DeepSeek的AIS发现了真正的人类欲望
DeepSeek在AI奖励模型中的突破性:加强AI推理和响应中国AI初创公司DeepSeek与Tsinghua University合作,在AI研究中取得了重要的里程碑。他们对AI奖励模型的创新方法有望彻底改变AI系统的学习方式
DeepCoder通过14B开放模型实现高编码效率
介绍DeepCoder-14b:开源编码模型的新领域,AI和Agentica的团队揭幕了DeepCoder-14b,这是一种开创性的编码模型,与Openai的O3-Mini(例如Openai的O3-Mini)肩并肩。这种令人兴奋的发展是基于FO的
コメント (10)
0/200
BrianWalker
2025年4月23日 10:37:03 GMT
This study on tracking hidden visits with cell phone data and ML is mind-blowing 🤯 It's cool to see how researchers from different countries are teaming up to uncover these patterns. But it's also a bit creepy knowing our movements can be tracked so easily. Still, super interesting and definitely worth a read! 📚
0
BenHernández
2025年4月23日 10:37:03 GMT
携帯電話データと機械学習を使って隠れた訪問を追跡するこの研究は驚きです🤯 異なる国の研究者が協力してこれらのパターンを明らかにしているのはクールです。でも、私たちの移動がこんなに簡単に追跡されるのはちょっと気味悪いです。でも、とても興味深くて読む価値があります!📚
0
HarryLewis
2025年4月23日 10:37:03 GMT
휴대전화 데이터와 머신러닝으로 숨겨진 방문을 추적하는 이 연구는 정말 놀랍네요 🤯 다른 나라의 연구자들이 협력해서 이런 패턴을 밝히는 건 멋지죠. 하지만 우리의 이동이 이렇게 쉽게 추적된다는 게 조금 섬뜩하기도 해요. 그래도 정말 흥미롭고 읽을 가치가 있어요! 📚
0
JasonMartin
2025年4月23日 10:37:03 GMT
Este estudo sobre o rastreamento de visitas ocultas com dados de celular e ML é impressionante 🤯 É legal ver como pesquisadores de diferentes países estão colaborando para descobrir esses padrões. Mas também é um pouco assustador saber que nossos movimentos podem ser rastreados tão facilmente. Ainda assim, muito interessante e vale a pena ler! 📚
0
RaymondRodriguez
2025年4月23日 10:37:03 GMT
Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚
0
SamuelClark
2025年4月23日 7:52:14 GMT
This study on 'hidden visits' using cell phone data and machine learning is mind-blowing! It's fascinating how they can track movements so accurately. But it's also a bit creepy, isn't it? 🤔📱
0






研究者が電話だけに頼らずに国全体の私たちの動きをどのように追跡したか疑問に思ったことがあるなら、中国と米国の研究者による魅力的な研究が洞察を提供します。彼らの共同作業は、私たちが行う「隠された訪問」を明らかにするために機械学習の使用を掘り下げます。私たちは携帯電話を十分に使用していないため、標準の通信データには表示されない旅行です。
**スパースコールの詳細レコードデータからの隠された訪問を識別する**というタイトルの研究は、香港大学のZhan Zhaoが、ボストンの北東大学のハリスN. Koutsopoulos、MITのJinhua Zhaoとともに先頭に立っています。彼らの目標?モバイルデータ、SMS、音声通話など、モバイル接続レコードを活用するために、非常にアクティブなユーザーから、携帯電話を使用する頻度ではない人の移動パターンをモデル化および予測します。
*コール詳細レコード(CD)データからトリップ情報を抽出するための大まかな回路図。*出典:https://arxiv.org/pdf/2106.12885.pdf
チームは、潜在的なプライバシーが彼らの仕事を引き起こす懸念を認めていますが、彼らの目的は、個々の旅にズームインするのではなく、運動パターンのより一般化された理解を得ることであることを強調しています。彼らはまた、そのような研究のバックボーンであるCall Detail Record(CDR)データにはその制限があることを指摘しています。多くの場合、空間分解能が低く、携帯電話の塔と比較してユーザーの位置が変化しているため、「位置付けノイズ」を受けやすくなります。しかし、彼らは、この不正確さは実際にはプライバシーセーフガードとして機能すると主張しています。
** '私たちの研究のターゲットアプリケーションは、旅行の検出とOD推定\ [\*\]であり、個々のレベルではなく集計レベルで行われます。開発されたモデルは、データ転送を必要とせずに、通信担体のデータベースサーバーに直接展開できます。さらに、ソーシャルメディアやクレジットカードトランザクションデータなど、他の形式のビッグデータと比較して、CDRデータは個人的なプライバシーの点では比較的邪魔になりません。さらに、そのローカリゼーションエラーは、正確なユーザーの場所をマスクするのに役立ち、プライバシー保存の別の層を提供します。 '**
経過時間間隔(ETI)
必ずしもスマートフォンではなく、携帯電話を使用して移動しているとき、私たちの場所を特定するためのツールとしてのCDRデータの制限が明らかになります。経過時間間隔(ETIS)、通話をしたり受信したりしない旅の期間は、動きを追跡するための重要なマーカーです。これらの「沈黙」の間隔は、グリッドから一時的に消滅する可能性があります。
研究者は、これらのギャップがA> Bの旅を理解しようとする分析システムとどのように干渉するかを強調しています。データのスパースは、「観察されていない旅行」を隠している可能性があります。彼らの新しい方法は、ETISの時空間的コンテキストを分析し、「ユーザーの個々の特性」を検討することにより、これに取り組みます。
データセット
コアトレーニングセットを構築するために、研究者は人口600万人の中国の都市の主要な携帯電話サービスオペレーターのデータを使用しました。このデータセットには、2013年11月の300万人のユーザーからの20億以上の携帯電話トランザクションが含まれており、音声通話とデータアクセスレコードのみに焦点を当てています。特に、SMSデータは含まれておらず、まばらなデータを処理するという課題に追加されました。
データには、暗号化された一意のID、ロケーションエーカーコード(LAC)、タイムスタンプ、LACにリンクされた携帯電話IDがトランザクションに関与する特定の携帯電話タワーを識別し、発信/着信コールまたはデータの使用かを示すイベントIDが含まれていました。
*隠された訪問の識別のためにツリーを処理します。*
この情報は、セルタワーの操作データベースで相互参照され、研究者が各通信イベントに関連するタワーの経度と緯度座標を特定できるようにしました。彼らは、データセット内の9000のセルタワーを特定しました。
研究者たちは、これらの記録が朝と午後にピークに達するため、コールレコードのみに基づいて旅行の目的地を正確に推測することが難しいことに注目しました。電話は旅に先行する可能性があり、それをトリガーすることさえあるかもしれないので、これは目的地の推定を歪める可能性があります。
*1日の間にモバイル使用パターン。*
メッセージングアプリなど、ユーザーが開始したデータ使用量でも同様の課題が生じます。ただし、これらの隠された動きを識別するのに役立つ、新しいメッセージやGPSやテレメトリを含む他のデータのAPIの体系的なポーリングなど、「自動化された」データの使用法などです。
処理
研究者は、ロジスティック回帰、サポートベクターマシン(SVM)、ランダムフォレスト、勾配ブーストアンサンブルアプローチなど、この問題に取り組むために、さまざまな機械学習分類器を採用しました。これらは、デフォルト設定でScikit-Learnを使用してPythonで実装されました。
これらのうち、ロジスティック回帰は、最も解釈可能なモデルパラメーターを提供しました。チームはまた、ETIが長くなると隠された訪問が起こる可能性を高め、朝の発生率が高いことを発見しました。逆に、ユーザーのCDRデータが多くの目的地またはウェイポイントを明確に示した場合、隠された訪問の可能性は低くなりました。この発見は、最もアクティブなユーザーが自分の動きの詳細な画像を提供し、そこからアクティブなユーザーの動作を推測できるという研究の中心的な原則をサポートしています。
彼らの結論として、研究者は、彼らのアプローチが、スマートカードデータや地理的なソーシャルメディア情報など、他のタイプの輸送データに適用できることを示唆しています。
この研究は、エネルギー財団中国と中国の持続可能な交通センターからの資金提供によって支援されました。
* \*起源の捨て*


This study on tracking hidden visits with cell phone data and ML is mind-blowing 🤯 It's cool to see how researchers from different countries are teaming up to uncover these patterns. But it's also a bit creepy knowing our movements can be tracked so easily. Still, super interesting and definitely worth a read! 📚




携帯電話データと機械学習を使って隠れた訪問を追跡するこの研究は驚きです🤯 異なる国の研究者が協力してこれらのパターンを明らかにしているのはクールです。でも、私たちの移動がこんなに簡単に追跡されるのはちょっと気味悪いです。でも、とても興味深くて読む価値があります!📚




휴대전화 데이터와 머신러닝으로 숨겨진 방문을 추적하는 이 연구는 정말 놀랍네요 🤯 다른 나라의 연구자들이 협력해서 이런 패턴을 밝히는 건 멋지죠. 하지만 우리의 이동이 이렇게 쉽게 추적된다는 게 조금 섬뜩하기도 해요. 그래도 정말 흥미롭고 읽을 가치가 있어요! 📚




Este estudo sobre o rastreamento de visitas ocultas com dados de celular e ML é impressionante 🤯 É legal ver como pesquisadores de diferentes países estão colaborando para descobrir esses padrões. Mas também é um pouco assustador saber que nossos movimentos podem ser rastreados tão facilmente. Ainda assim, muito interessante e vale a pena ler! 📚




Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚




This study on 'hidden visits' using cell phone data and machine learning is mind-blowing! It's fascinating how they can track movements so accurately. But it's also a bit creepy, isn't it? 🤔📱












