オプション
ニュース
携帯電話のデータと機械学習で「隠された訪問」を明らかにする

携帯電話のデータと機械学習で「隠された訪問」を明らかにする

2025年4月23日
59

研究者が電話のみに頼らずに国をまたぐ移動を追跡する方法に興味があるなら、中国と米国の研究者による興味深い研究がその洞察を提供します。彼らの共同研究は、機械学習を用いて私たちが行う「隠れた訪問」—電話を十分に使っていないために標準的な通信データに現れない移動—を明らかにすることに焦点を当てています。

この研究は、**Identifying Hidden Visits From Sparse Call Detail Record Data**と題され、香港大学のZhan Zhao、ボストンのノースイースタン大学のHaris N. Koutsopoulos、MITのJinhua Zhaoが主導しています。彼らの目標は?モバイルデータ、SMS、音声通話などのモバイル接続記録を、活動的なユーザーから活用し、電話をあまり使わないユーザーの移動パターンをモデル化し予測することです。

通話詳細記録(CDR)データから旅行情報を抽出するための概略図。出典: https://arxiv.org/pdf/2106.12885.pdf*通話詳細記録(CDR)データから旅行情報を抽出するための概略図。* 出典: https://arxiv.org/pdf/2106.12885.pdf

チームは研究が引き起こす可能性のあるプライバシー問題を認識しつつ、個々の移動に焦点を当てるのではなく、移動パターンの一般化された理解を目指していると強調しています。また、通話詳細記録(CDR)データには限界があり、空間分解能が低く、ユーザーの携帯電話塔に対する位置変化による「位置ノイズ」に影響されやすいと指摘しています。しかし、この不正確さがプライバシーの保護に役立つと主張しています:

**「我々の研究の対象アプリケーションは、旅行検出とOD推定$$ \* $$であり、個人レベルではなく集計レベルで行われます。開発されたモデルは通信事業者のデータベースサーバーに直接展開でき、データ転送の必要はありません。さらに、ソーシャルメディアやクレジットカード取引データなどの他のビッグデータと比較して、CDRデータは個人プライバシーの観点から比較的侵入度が低いです。また、その位置誤差は正確なユーザー位置を隠すのに役立ち、さらなるプライバシー保護を提供します。」**

経過時間間隔(ETIs)

スマートフォンでなくても、移動中に携帯電話を持ち歩く際、CDRデータが位置を特定するツールとしての限界が明らかになります。経過時間間隔(ETIs)、つまり旅程中に通話の発着信がない期間は、移動を追跡する重要なマーカーです。これらの「沈黙」の間隔は、私たちを一時的にグリッドから消す可能性があります。

研究者は、これらのギャップがA>Bの移動を理解しようとする分析システムにどのように干渉するかを強調しています。データの希薄さが「観測されない旅行」を隠している可能性があります。彼らの新しい方法は、ETIsの時空間コンテキストを分析し、「ユーザーの個々の特性」を考慮することでこれに取り組んでいます。

データセット

研究者は、600万人の人口を持つ中国の都市の主要な携帯電話サービス事業者からデータを収集し、主要なトレーニングセットを構築しました。このデータセットは、2013年11月の300万ユーザーからの20億件以上の携帯電話取引を含み、音声通話とデータアクセス記録に限定されています。SMSデータは含まれておらず、希薄なデータに対処する課題を増やしました。

データには暗号化されたユニークID、位置エリアコード(LAC)、タイムスタンプ、LACに関連する携帯電話塔を特定する携帯電話ID、発信/着信通話またはデータ使用を示すイベントIDが含まれていました。

隠れた訪問を特定するためのプロセスツリー。*隠れた訪問を特定するためのプロセスツリー。*

この情報は携帯電話塔の運用データベースと照合され、研究者は各通信イベントに関連する塔の経度と緯度座標を特定しました。データセット内で9000の携帯電話塔を特定しました。

研究者は、通話記録だけで旅行の目的地を正確に推測することの難しさを指摘し、これらの記録は朝と午後にピークを迎え、典型的な旅行パターンと一致します。通話が旅行に先行し、それを引き起こす可能性があるため、目的地の推定が歪む可能性があります。

1日を通じたモバイル使用パターン。*1日を通じたモバイル使用パターン。*

ユーザー主導のデータ使用、例えばメッセージングアプリでも同様の課題が生じます。しかし、メッセージや他のデータ(GPSやアプリ間のテレメトリを含む)のAPIの定期的なポーリングのような「自動化された」データ使用が、これらの隠れた移動を特定するのに役立ちます。

処理

研究者は、ロジスティック回帰、サポートベクターマシン(SVM)、ランダムフォレスト、勾配ブースティングアンサンブルアプローチなど、さまざまな機械学習分類器をこの問題に適用しました。これらはPythonのscikit-learnを使用してデフォルト設定で実装されました。

その中でも、ロジスティック回帰が最も解釈可能なモデルパラメータを提供しました。チームは、ETIsが長いほど隠れた訪問が発生する可能性が高くなり、朝にその発生率が高いことを発見しました。逆に、ユーザーのCDRデータが多くの目的地や経由地を明確に示している場合、隠れた訪問の可能性は低くなります。この発見は、活動的なユーザーがその移動の詳細な絵を提供し、そこから活動の少ないユーザーの行動を推測できるという研究の核心原則を支持しています。

結論として、研究者は彼らのアプローチがスマートカードデータやジオロケーション付きのソーシャルメディア情報などの他の種類の交通データにも適用可能だと示唆しています。

この研究は、Energy Foundation ChinaおよびChina Sustainable Transportation Centerからの資金提供を受けています。

*\* 起点-終点*

関連記事
Microsoft Study Reveals AI Models' Limitations in Software Debugging Microsoft Study Reveals AI Models' Limitations in Software Debugging OpenAI、Anthropic、その他の主要AIラボのAIモデルは、コーディングタスクにますます活用されています。GoogleのCEOであるSundar Pichaiは10月に、AIが同社の新しいコードの25%を生成していると述べ、MetaのCEOであるMark Zuckerbergは、ソーシャルメディア大手内でAIコーディングツールを広く導入することを目指しています。しかし、最高性能のモデルで
AI駆動のソリューションが世界の炭素排出量を大幅に削減可能 AI駆動のソリューションが世界の炭素排出量を大幅に削減可能 ロンドン経済学校とSystemiqの最近の研究によると、人工知能は現代の利便性を犠牲にせず、世界の炭素排出量を大幅に削減でき、気候変動対策の重要な味方となる可能性がある。この研究は、3つのセクターでのインテリジェントなAIアプリケーションが、2035年までに年間32億~54億トンの温室効果ガス排出量を削減できると強調している。一般的な懸念とは異なり、これらの削減はAI運用の炭素フットプリントをはる
新しい研究がLLMが実際にどれだけデータを記憶するかを明らかに 新しい研究がLLMが実際にどれだけデータを記憶するかを明らかに AIモデルは実際にどれだけ記憶するのか? 新しい研究が驚くべき洞察を明らかにChatGPT、Claude、Geminiなどの大規模言語モデル(LLM)は、本、ウェブサイト、コード、そして画像や音声などのマルチメディアからなる膨大なデータセット—何兆もの単語—で訓練されています。しかし、そのデータはどうなるのでしょうか? これらのモデルは本当に言語を「理解」しているのか、それとも記憶した断片をただ繰
コメント (16)
0/200
JuanLewis
JuanLewis 2025年8月1日 22:47:34 JST

This article blew my mind! Using phone data and ML to track hidden visits is so cool, but kinda creepy too. 🤯 Wonder how they balance privacy with all this tech wizardry.

RalphSanchez
RalphSanchez 2025年4月24日 13:36:16 JST

이 도구는 정말 놀랍습니다! 내 이동을 추적하는 데 유용하지만 조금 무섭기도 해요. 데이터를 삭제할 수 있는 옵션이 있으면 좋겠어요. 😓

MatthewScott
MatthewScott 2025年4月24日 6:35:24 JST

¡Esta herramienta es alucinante! Es como tener un detective en mi bolsillo, descubriendo todos esos viajes secretos que nunca supe. Muy útil para rastrear mis propios movimientos, pero un poco espeluznante también. ¿Quizás deberían añadir una opción para eliminar datos? 🤔

RalphHill
RalphHill 2025年4月24日 5:51:52 JST

Este estudo sobre 'visitas ocultas' usando dados de celular e aprendizado de máquina é impressionante! É fascinante como eles podem rastrear movimentos com tanta precisão. Mas também é um pouco assustador, não é? 🤔📱

WilliamMiller
WilliamMiller 2025年4月23日 20:05:02 JST

Essa ferramenta é incrível! Parece que tenho um detetive no meu bolso, descobrindo todas aquelas viagens secretas que eu nunca soube. Muito útil para rastrear meus próprios movimentos, mas um pouco assustador também. Talvez eles devam adicionar uma opção para excluir dados? 🤔

RaymondRodriguez
RaymondRodriguez 2025年4月23日 19:37:03 JST

Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚

トップに戻ります
OR