携帯電話のデータと機械学習で「隠された訪問」を明らかにする
研究者が電話のみに頼らずに国をまたぐ移動を追跡する方法に興味があるなら、中国と米国の研究者による興味深い研究がその洞察を提供します。彼らの共同研究は、機械学習を用いて私たちが行う「隠れた訪問」—電話を十分に使っていないために標準的な通信データに現れない移動—を明らかにすることに焦点を当てています。
この研究は、**Identifying Hidden Visits From Sparse Call Detail Record Data**と題され、香港大学のZhan Zhao、ボストンのノースイースタン大学のHaris N. Koutsopoulos、MITのJinhua Zhaoが主導しています。彼らの目標は?モバイルデータ、SMS、音声通話などのモバイル接続記録を、活動的なユーザーから活用し、電話をあまり使わないユーザーの移動パターンをモデル化し予測することです。
*通話詳細記録(CDR)データから旅行情報を抽出するための概略図。* 出典: https://arxiv.org/pdf/2106.12885.pdf
チームは研究が引き起こす可能性のあるプライバシー問題を認識しつつ、個々の移動に焦点を当てるのではなく、移動パターンの一般化された理解を目指していると強調しています。また、通話詳細記録(CDR)データには限界があり、空間分解能が低く、ユーザーの携帯電話塔に対する位置変化による「位置ノイズ」に影響されやすいと指摘しています。しかし、この不正確さがプライバシーの保護に役立つと主張しています:
**「我々の研究の対象アプリケーションは、旅行検出とOD推定$$ \* $$であり、個人レベルではなく集計レベルで行われます。開発されたモデルは通信事業者のデータベースサーバーに直接展開でき、データ転送の必要はありません。さらに、ソーシャルメディアやクレジットカード取引データなどの他のビッグデータと比較して、CDRデータは個人プライバシーの観点から比較的侵入度が低いです。また、その位置誤差は正確なユーザー位置を隠すのに役立ち、さらなるプライバシー保護を提供します。」**
経過時間間隔(ETIs)
スマートフォンでなくても、移動中に携帯電話を持ち歩く際、CDRデータが位置を特定するツールとしての限界が明らかになります。経過時間間隔(ETIs)、つまり旅程中に通話の発着信がない期間は、移動を追跡する重要なマーカーです。これらの「沈黙」の間隔は、私たちを一時的にグリッドから消す可能性があります。
研究者は、これらのギャップがA>Bの移動を理解しようとする分析システムにどのように干渉するかを強調しています。データの希薄さが「観測されない旅行」を隠している可能性があります。彼らの新しい方法は、ETIsの時空間コンテキストを分析し、「ユーザーの個々の特性」を考慮することでこれに取り組んでいます。
データセット
研究者は、600万人の人口を持つ中国の都市の主要な携帯電話サービス事業者からデータを収集し、主要なトレーニングセットを構築しました。このデータセットは、2013年11月の300万ユーザーからの20億件以上の携帯電話取引を含み、音声通話とデータアクセス記録に限定されています。SMSデータは含まれておらず、希薄なデータに対処する課題を増やしました。
データには暗号化されたユニークID、位置エリアコード(LAC)、タイムスタンプ、LACに関連する携帯電話塔を特定する携帯電話ID、発信/着信通話またはデータ使用を示すイベントIDが含まれていました。
*隠れた訪問を特定するためのプロセスツリー。*
この情報は携帯電話塔の運用データベースと照合され、研究者は各通信イベントに関連する塔の経度と緯度座標を特定しました。データセット内で9000の携帯電話塔を特定しました。
研究者は、通話記録だけで旅行の目的地を正確に推測することの難しさを指摘し、これらの記録は朝と午後にピークを迎え、典型的な旅行パターンと一致します。通話が旅行に先行し、それを引き起こす可能性があるため、目的地の推定が歪む可能性があります。
*1日を通じたモバイル使用パターン。*
ユーザー主導のデータ使用、例えばメッセージングアプリでも同様の課題が生じます。しかし、メッセージや他のデータ(GPSやアプリ間のテレメトリを含む)のAPIの定期的なポーリングのような「自動化された」データ使用が、これらの隠れた移動を特定するのに役立ちます。
処理
研究者は、ロジスティック回帰、サポートベクターマシン(SVM)、ランダムフォレスト、勾配ブースティングアンサンブルアプローチなど、さまざまな機械学習分類器をこの問題に適用しました。これらはPythonのscikit-learnを使用してデフォルト設定で実装されました。
その中でも、ロジスティック回帰が最も解釈可能なモデルパラメータを提供しました。チームは、ETIsが長いほど隠れた訪問が発生する可能性が高くなり、朝にその発生率が高いことを発見しました。逆に、ユーザーのCDRデータが多くの目的地や経由地を明確に示している場合、隠れた訪問の可能性は低くなります。この発見は、活動的なユーザーがその移動の詳細な絵を提供し、そこから活動の少ないユーザーの行動を推測できるという研究の核心原則を支持しています。
結論として、研究者は彼らのアプローチがスマートカードデータやジオロケーション付きのソーシャルメディア情報などの他の種類の交通データにも適用可能だと示唆しています。
この研究は、Energy Foundation ChinaおよびChina Sustainable Transportation Centerからの資金提供を受けています。
*\* 起点-終点*
関連記事
Google Cloud が科学研究と発見のブレークスルーを促進
デジタル革命は、前例のない計算能力によって科学的方法論を変革している。最先端のテクノロジーは現在、理論的なフレームワークと実験室での実験の両方を補強し、高度なシミュレーションとビッグデータ分析によって分野横断的なブレークスルーを推進しています。基礎研究、スケーラブルなクラウドアーキテクチャ、人工知能開発に戦略的に投資することで、私たちは科学の進歩を加速させるエコシステムを確立しました。世界トップク
AIが科学研究を加速し、実社会により大きなインパクトを与える
グーグルは一貫してAIを科学的進歩の触媒として活用しており、今日の発見ペースは驚異的な新水準に達している。この加速は研究サイクルを一変させ、基礎的なブレークスルーを実用的な応用へと、かつて経験したことのない速さで転換させている。AIは人間の創造性に取って代わるどころか、人間の潜在能力を強力に増幅させる役割を果たしている。私たちの研究者たちは、基礎的な科学的課題に取り組むためにAIを採用し、世界的な
AIにおける倫理:オートメーションにおけるバイアスとコンプライアンスの課題に取り組む
オートメーションが産業全体に深く浸透するにつれ、倫理的配慮が重要な優先事項として浮上している。意思決定アルゴリズムは現在、雇用機会、金融サービス、医療、法的プロセスなど、社会の重要な側面に影響を及ぼしており、厳格な倫理的枠組みが求められている。適切なガバナンスがなければ、こうした強力なシステムは既存の不平等を増幅し、広範な害をもたらす危険性がある。AIシステムのバイアスを理解するアルゴリズムのバイ
コメント (17)
0/200
KennethWalker
2025年8月10日 20:01:00 JST
This study on tracking movements with phone data is wild! 😲 It’s like our phones are secretly spilling where we’ve been. Kinda creepy, but super cool how machine learning digs into those 'hidden visits.' Makes me wonder what else they can find out!
0
JuanLewis
2025年8月1日 22:47:34 JST
This article blew my mind! Using phone data and ML to track hidden visits is so cool, but kinda creepy too. 🤯 Wonder how they balance privacy with all this tech wizardry.
0
RalphSanchez
2025年4月24日 13:36:16 JST
이 도구는 정말 놀랍습니다! 내 이동을 추적하는 데 유용하지만 조금 무섭기도 해요. 데이터를 삭제할 수 있는 옵션이 있으면 좋겠어요. 😓
0
MatthewScott
2025年4月24日 6:35:24 JST
¡Esta herramienta es alucinante! Es como tener un detective en mi bolsillo, descubriendo todos esos viajes secretos que nunca supe. Muy útil para rastrear mis propios movimientos, pero un poco espeluznante también. ¿Quizás deberían añadir una opción para eliminar datos? 🤔
0
RalphHill
2025年4月24日 5:51:52 JST
Este estudo sobre 'visitas ocultas' usando dados de celular e aprendizado de máquina é impressionante! É fascinante como eles podem rastrear movimentos com tanta precisão. Mas também é um pouco assustador, não é? 🤔📱
0
WilliamMiller
2025年4月23日 20:05:02 JST
Essa ferramenta é incrível! Parece que tenho um detetive no meu bolso, descobrindo todas aquelas viagens secretas que eu nunca soube. Muito útil para rastrear meus próprios movimentos, mas um pouco assustador também. Talvez eles devam adicionar uma opção para excluir dados? 🤔
0
研究者が電話のみに頼らずに国をまたぐ移動を追跡する方法に興味があるなら、中国と米国の研究者による興味深い研究がその洞察を提供します。彼らの共同研究は、機械学習を用いて私たちが行う「隠れた訪問」—電話を十分に使っていないために標準的な通信データに現れない移動—を明らかにすることに焦点を当てています。
この研究は、**Identifying Hidden Visits From Sparse Call Detail Record Data**と題され、香港大学のZhan Zhao、ボストンのノースイースタン大学のHaris N. Koutsopoulos、MITのJinhua Zhaoが主導しています。彼らの目標は?モバイルデータ、SMS、音声通話などのモバイル接続記録を、活動的なユーザーから活用し、電話をあまり使わないユーザーの移動パターンをモデル化し予測することです。
*通話詳細記録(CDR)データから旅行情報を抽出するための概略図。* 出典: https://arxiv.org/pdf/2106.12885.pdf
チームは研究が引き起こす可能性のあるプライバシー問題を認識しつつ、個々の移動に焦点を当てるのではなく、移動パターンの一般化された理解を目指していると強調しています。また、通話詳細記録(CDR)データには限界があり、空間分解能が低く、ユーザーの携帯電話塔に対する位置変化による「位置ノイズ」に影響されやすいと指摘しています。しかし、この不正確さがプライバシーの保護に役立つと主張しています:
**「我々の研究の対象アプリケーションは、旅行検出とOD推定$$ \* $$であり、個人レベルではなく集計レベルで行われます。開発されたモデルは通信事業者のデータベースサーバーに直接展開でき、データ転送の必要はありません。さらに、ソーシャルメディアやクレジットカード取引データなどの他のビッグデータと比較して、CDRデータは個人プライバシーの観点から比較的侵入度が低いです。また、その位置誤差は正確なユーザー位置を隠すのに役立ち、さらなるプライバシー保護を提供します。」**
経過時間間隔(ETIs)
スマートフォンでなくても、移動中に携帯電話を持ち歩く際、CDRデータが位置を特定するツールとしての限界が明らかになります。経過時間間隔(ETIs)、つまり旅程中に通話の発着信がない期間は、移動を追跡する重要なマーカーです。これらの「沈黙」の間隔は、私たちを一時的にグリッドから消す可能性があります。
研究者は、これらのギャップがA>Bの移動を理解しようとする分析システムにどのように干渉するかを強調しています。データの希薄さが「観測されない旅行」を隠している可能性があります。彼らの新しい方法は、ETIsの時空間コンテキストを分析し、「ユーザーの個々の特性」を考慮することでこれに取り組んでいます。
データセット
研究者は、600万人の人口を持つ中国の都市の主要な携帯電話サービス事業者からデータを収集し、主要なトレーニングセットを構築しました。このデータセットは、2013年11月の300万ユーザーからの20億件以上の携帯電話取引を含み、音声通話とデータアクセス記録に限定されています。SMSデータは含まれておらず、希薄なデータに対処する課題を増やしました。
データには暗号化されたユニークID、位置エリアコード(LAC)、タイムスタンプ、LACに関連する携帯電話塔を特定する携帯電話ID、発信/着信通話またはデータ使用を示すイベントIDが含まれていました。
*隠れた訪問を特定するためのプロセスツリー。*
この情報は携帯電話塔の運用データベースと照合され、研究者は各通信イベントに関連する塔の経度と緯度座標を特定しました。データセット内で9000の携帯電話塔を特定しました。
研究者は、通話記録だけで旅行の目的地を正確に推測することの難しさを指摘し、これらの記録は朝と午後にピークを迎え、典型的な旅行パターンと一致します。通話が旅行に先行し、それを引き起こす可能性があるため、目的地の推定が歪む可能性があります。
*1日を通じたモバイル使用パターン。*
ユーザー主導のデータ使用、例えばメッセージングアプリでも同様の課題が生じます。しかし、メッセージや他のデータ(GPSやアプリ間のテレメトリを含む)のAPIの定期的なポーリングのような「自動化された」データ使用が、これらの隠れた移動を特定するのに役立ちます。
処理
研究者は、ロジスティック回帰、サポートベクターマシン(SVM)、ランダムフォレスト、勾配ブースティングアンサンブルアプローチなど、さまざまな機械学習分類器をこの問題に適用しました。これらはPythonのscikit-learnを使用してデフォルト設定で実装されました。
その中でも、ロジスティック回帰が最も解釈可能なモデルパラメータを提供しました。チームは、ETIsが長いほど隠れた訪問が発生する可能性が高くなり、朝にその発生率が高いことを発見しました。逆に、ユーザーのCDRデータが多くの目的地や経由地を明確に示している場合、隠れた訪問の可能性は低くなります。この発見は、活動的なユーザーがその移動の詳細な絵を提供し、そこから活動の少ないユーザーの行動を推測できるという研究の核心原則を支持しています。
結論として、研究者は彼らのアプローチがスマートカードデータやジオロケーション付きのソーシャルメディア情報などの他の種類の交通データにも適用可能だと示唆しています。
この研究は、Energy Foundation ChinaおよびChina Sustainable Transportation Centerからの資金提供を受けています。
*\* 起点-終点*



This study on tracking movements with phone data is wild! 😲 It’s like our phones are secretly spilling where we’ve been. Kinda creepy, but super cool how machine learning digs into those 'hidden visits.' Makes me wonder what else they can find out!




This article blew my mind! Using phone data and ML to track hidden visits is so cool, but kinda creepy too. 🤯 Wonder how they balance privacy with all this tech wizardry.




이 도구는 정말 놀랍습니다! 내 이동을 추적하는 데 유용하지만 조금 무섭기도 해요. 데이터를 삭제할 수 있는 옵션이 있으면 좋겠어요. 😓




¡Esta herramienta es alucinante! Es como tener un detective en mi bolsillo, descubriendo todos esos viajes secretos que nunca supe. Muy útil para rastrear mis propios movimientos, pero un poco espeluznante también. ¿Quizás deberían añadir una opción para eliminar datos? 🤔




Este estudo sobre 'visitas ocultas' usando dados de celular e aprendizado de máquina é impressionante! É fascinante como eles podem rastrear movimentos com tanta precisão. Mas também é um pouco assustador, não é? 🤔📱




Essa ferramenta é incrível! Parece que tenho um detetive no meu bolso, descobrindo todas aquelas viagens secretas que eu nunca soube. Muito útil para rastrear meus próprios movimentos, mas um pouco assustador também. Talvez eles devam adicionar uma opção para excluir dados? 🤔












