使用手机数据和机器学习探索我们的“隐藏访问”
2025年04月22日
JustinScott
0
如果您曾经想知道研究人员如何在不依靠电话的情况下跟踪我们整个国家的运动,那么中国和美国的研究人员的一项令人着迷的研究提供了一些见识。他们的协作工作深入研究了使用机器学习来揭示我们进行的“隐藏访问” - 这些旅行不会出现在标准电信数据中,因为我们使用的电话不够。
这项名为**识别稀疏呼叫详细记录数据的隐藏访问**的研究由香港大学的Zhan Zhao和波士顿东北大学的Haris N. Koutsopoulos以及MIT的Jinhua Zhao和Jinhua Zhao率领。他们的目标?为了利用移动连接记录(例如移动数据,SMS和语音呼叫),从高度活跃的用户来建模和预测那些使用手机频率较低的人的运动模式。
*一种用于从呼叫详细记录(CD)数据提取旅行信息的粗略示意图。*来源:https://arxiv.org/pdf/2106.12885.pdf
尽管团队承认潜在的隐私涉及他们的工作提高,但他们强调,他们的目的是获得对运动模式的更普遍的理解,而不是放大个人旅程。他们还指出,这是此类研究的骨干的呼叫详细记录(CDR)数据具有其局限性。由于用户相对于手机塔的位置的变化,因此通常较低的空间分辨率,并且容易受到“定位噪声”的影响。但是,他们认为这种不准确实际上是一种隐私保护:
**'我们研究的目标应用是行程检测和OD估计\ [\*\],它是在总级别而不是个人级别进行的。开发的模型可以直接部署在电信运营商的数据库服务器上,而无需数据传输。此外,与其他形式的大数据(例如社交媒体或信用卡交易数据)相比,CDR数据在个人隐私方面相对较小。此外,其本地化错误有助于掩盖确切的用户位置,提供另一层隐私保护。'**
经过的时间间隔(ETIS)
当我们使用手机(不一定是智能手机)移动时,CDR数据作为确定位置的工具的局限性变得清晰。经过的时间间隔(ETI)是在我们不打电话或接听电话的旅程中的那些时期,是跟踪我们运动的关键标记。这些“沉默”间隔可以使我们暂时从网格中消失。
研究人员强调了这些差距如何干扰试图理解A> B旅程的分析系统。数据的稀疏性可能隐藏了“未观察到的旅行”。他们的新方法通过分析ETIS的时空环境并考虑“用户的个人特征”来解决此问题。
数据集
为了建立他们的核心训练集,研究人员使用了来自中国城市中主要人口的主要蜂窝服务运营商的数据,人口为600万。该数据集在2013年11月包括来自300万用户的20亿手机交易,仅关注语音通话和数据访问记录。值得注意的是,它们不包括SMS数据,这增加了处理稀疏数据的挑战。
数据包括一个加密的唯一ID,位置区域代码(LAC),时间戳,链接到LAC的手机ID,以识别交易中涉及的特定手机塔,以及事件ID,指示它是传出/传入的呼叫还是数据使用情况。
*处理树以识别隐藏的访问。*
该信息与单元塔操作数据库交叉引用,使研究人员能够指出与每个通信事件相关的塔的经度和纬度坐标。他们确定了数据集中的9000个手机塔。
研究人员指出,仅根据呼叫记录来准确猜测旅行目的地的难度,因为这些记录在早晨和下午达到顶峰,这与典型的旅行模式保持一致。由于电话可以在旅程之前,甚至可能触发它,因此这可能会偏向目标估计。
*一天中的移动使用模式。**
用户启动的数据使用情况(例如消息传递应用程序)也会出现类似的挑战。但是,这是“自动化”的数据使用情况,例如新消息或其他数据的API的系统轮询,包括跨应用程序的GPS和遥测,这有助于识别这些隐藏的运动。
加工
研究人员使用各种机器学习分类器来解决此问题,包括逻辑回归,支持向量机(SVM),随机森林和梯度增强合奏方法。这些是在Python中使用带有默认设置的Scikit-Learn实现的。
其中,逻辑回归提供了最可解释的模型参数。该团队还发现,更长的ETIS增加了进行隐藏访问的可能性,早晨发病率更高。相反,当用户的CDR数据清楚地显示出大量目的地或航路点时,隐藏访问的可能性较低。这一发现支持了他们研究的核心原则 - 最活跃的用户提供了他们的动作的详细图片,从中可以推断出较少活跃的用户的行为。
在他们的结论中,研究人员认为他们的方法可以应用于其他类型的过境数据,例如智能卡数据和地理社交媒体信息。
这项研究得到了中国能源基金会和中国可持续运输中心的资助。
* \*原始用途*
相关文章
DeepSeek的AIS发现了真正的人类欲望
DeepSeek在AI奖励模型中的突破性:加强AI推理和响应中国AI初创公司DeepSeek与Tsinghua University合作,在AI研究中取得了重要的里程碑。他们对AI奖励模型的创新方法有望彻底改变AI系统的学习方式
DeepCoder通过14B开放模型实现高编码效率
介绍DeepCoder-14b:开源编码模型的新领域,AI和Agentica的团队揭幕了DeepCoder-14b,这是一种开创性的编码模型,与Openai的O3-Mini(例如Openai的O3-Mini)肩并肩。这种令人兴奋的发展是基于FO的
评论 (10)
0/200
BrianWalker
2025年04月23日 10:37:03
This study on tracking hidden visits with cell phone data and ML is mind-blowing 🤯 It's cool to see how researchers from different countries are teaming up to uncover these patterns. But it's also a bit creepy knowing our movements can be tracked so easily. Still, super interesting and definitely worth a read! 📚
0
BenHernández
2025年04月23日 10:37:03
携帯電話データと機械学習を使って隠れた訪問を追跡するこの研究は驚きです🤯 異なる国の研究者が協力してこれらのパターンを明らかにしているのはクールです。でも、私たちの移動がこんなに簡単に追跡されるのはちょっと気味悪いです。でも、とても興味深くて読む価値があります!📚
0
HarryLewis
2025年04月23日 10:37:03
휴대전화 데이터와 머신러닝으로 숨겨진 방문을 추적하는 이 연구는 정말 놀랍네요 🤯 다른 나라의 연구자들이 협력해서 이런 패턴을 밝히는 건 멋지죠. 하지만 우리의 이동이 이렇게 쉽게 추적된다는 게 조금 섬뜩하기도 해요. 그래도 정말 흥미롭고 읽을 가치가 있어요! 📚
0
JasonMartin
2025年04月23日 10:37:03
Este estudo sobre o rastreamento de visitas ocultas com dados de celular e ML é impressionante 🤯 É legal ver como pesquisadores de diferentes países estão colaborando para descobrir esses padrões. Mas também é um pouco assustador saber que nossos movimentos podem ser rastreados tão facilmente. Ainda assim, muito interessante e vale a pena ler! 📚
0
RaymondRodriguez
2025年04月23日 10:37:03
Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚
0
SamuelClark
2025年04月23日 07:52:14
This study on 'hidden visits' using cell phone data and machine learning is mind-blowing! It's fascinating how they can track movements so accurately. But it's also a bit creepy, isn't it? 🤔📱
0






如果您曾经想知道研究人员如何在不依靠电话的情况下跟踪我们整个国家的运动,那么中国和美国的研究人员的一项令人着迷的研究提供了一些见识。他们的协作工作深入研究了使用机器学习来揭示我们进行的“隐藏访问” - 这些旅行不会出现在标准电信数据中,因为我们使用的电话不够。
这项名为**识别稀疏呼叫详细记录数据的隐藏访问**的研究由香港大学的Zhan Zhao和波士顿东北大学的Haris N. Koutsopoulos以及MIT的Jinhua Zhao和Jinhua Zhao率领。他们的目标?为了利用移动连接记录(例如移动数据,SMS和语音呼叫),从高度活跃的用户来建模和预测那些使用手机频率较低的人的运动模式。
*一种用于从呼叫详细记录(CD)数据提取旅行信息的粗略示意图。*来源:https://arxiv.org/pdf/2106.12885.pdf
尽管团队承认潜在的隐私涉及他们的工作提高,但他们强调,他们的目的是获得对运动模式的更普遍的理解,而不是放大个人旅程。他们还指出,这是此类研究的骨干的呼叫详细记录(CDR)数据具有其局限性。由于用户相对于手机塔的位置的变化,因此通常较低的空间分辨率,并且容易受到“定位噪声”的影响。但是,他们认为这种不准确实际上是一种隐私保护:
**'我们研究的目标应用是行程检测和OD估计\ [\*\],它是在总级别而不是个人级别进行的。开发的模型可以直接部署在电信运营商的数据库服务器上,而无需数据传输。此外,与其他形式的大数据(例如社交媒体或信用卡交易数据)相比,CDR数据在个人隐私方面相对较小。此外,其本地化错误有助于掩盖确切的用户位置,提供另一层隐私保护。'**
经过的时间间隔(ETIS)
当我们使用手机(不一定是智能手机)移动时,CDR数据作为确定位置的工具的局限性变得清晰。经过的时间间隔(ETI)是在我们不打电话或接听电话的旅程中的那些时期,是跟踪我们运动的关键标记。这些“沉默”间隔可以使我们暂时从网格中消失。
研究人员强调了这些差距如何干扰试图理解A> B旅程的分析系统。数据的稀疏性可能隐藏了“未观察到的旅行”。他们的新方法通过分析ETIS的时空环境并考虑“用户的个人特征”来解决此问题。
数据集
为了建立他们的核心训练集,研究人员使用了来自中国城市中主要人口的主要蜂窝服务运营商的数据,人口为600万。该数据集在2013年11月包括来自300万用户的20亿手机交易,仅关注语音通话和数据访问记录。值得注意的是,它们不包括SMS数据,这增加了处理稀疏数据的挑战。
数据包括一个加密的唯一ID,位置区域代码(LAC),时间戳,链接到LAC的手机ID,以识别交易中涉及的特定手机塔,以及事件ID,指示它是传出/传入的呼叫还是数据使用情况。
*处理树以识别隐藏的访问。*
该信息与单元塔操作数据库交叉引用,使研究人员能够指出与每个通信事件相关的塔的经度和纬度坐标。他们确定了数据集中的9000个手机塔。
研究人员指出,仅根据呼叫记录来准确猜测旅行目的地的难度,因为这些记录在早晨和下午达到顶峰,这与典型的旅行模式保持一致。由于电话可以在旅程之前,甚至可能触发它,因此这可能会偏向目标估计。
*一天中的移动使用模式。**
用户启动的数据使用情况(例如消息传递应用程序)也会出现类似的挑战。但是,这是“自动化”的数据使用情况,例如新消息或其他数据的API的系统轮询,包括跨应用程序的GPS和遥测,这有助于识别这些隐藏的运动。
加工
研究人员使用各种机器学习分类器来解决此问题,包括逻辑回归,支持向量机(SVM),随机森林和梯度增强合奏方法。这些是在Python中使用带有默认设置的Scikit-Learn实现的。
其中,逻辑回归提供了最可解释的模型参数。该团队还发现,更长的ETIS增加了进行隐藏访问的可能性,早晨发病率更高。相反,当用户的CDR数据清楚地显示出大量目的地或航路点时,隐藏访问的可能性较低。这一发现支持了他们研究的核心原则 - 最活跃的用户提供了他们的动作的详细图片,从中可以推断出较少活跃的用户的行为。
在他们的结论中,研究人员认为他们的方法可以应用于其他类型的过境数据,例如智能卡数据和地理社交媒体信息。
这项研究得到了中国能源基金会和中国可持续运输中心的资助。
* \*原始用途*


This study on tracking hidden visits with cell phone data and ML is mind-blowing 🤯 It's cool to see how researchers from different countries are teaming up to uncover these patterns. But it's also a bit creepy knowing our movements can be tracked so easily. Still, super interesting and definitely worth a read! 📚




携帯電話データと機械学習を使って隠れた訪問を追跡するこの研究は驚きです🤯 異なる国の研究者が協力してこれらのパターンを明らかにしているのはクールです。でも、私たちの移動がこんなに簡単に追跡されるのはちょっと気味悪いです。でも、とても興味深くて読む価値があります!📚




휴대전화 데이터와 머신러닝으로 숨겨진 방문을 추적하는 이 연구는 정말 놀랍네요 🤯 다른 나라의 연구자들이 협력해서 이런 패턴을 밝히는 건 멋지죠. 하지만 우리의 이동이 이렇게 쉽게 추적된다는 게 조금 섬뜩하기도 해요. 그래도 정말 흥미롭고 읽을 가치가 있어요! 📚




Este estudo sobre o rastreamento de visitas ocultas com dados de celular e ML é impressionante 🤯 É legal ver como pesquisadores de diferentes países estão colaborando para descobrir esses padrões. Mas também é um pouco assustador saber que nossos movimentos podem ser rastreados tão facilmente. Ainda assim, muito interessante e vale a pena ler! 📚




Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚




This study on 'hidden visits' using cell phone data and machine learning is mind-blowing! It's fascinating how they can track movements so accurately. But it's also a bit creepy, isn't it? 🤔📱












