Hogar Noticias Descubrir nuestras 'visitas ocultas' con datos de teléfonos celulares y aprendizaje automático

Descubrir nuestras 'visitas ocultas' con datos de teléfonos celulares y aprendizaje automático

22 de abril de 2025
JustinScott
0

Si alguna vez se ha preguntado cómo los investigadores rastrean nuestros movimientos en un país sin depender únicamente de las llamadas telefónicas, un estudio fascinante realizado por investigadores de China y Estados Unidos ofrece cierta idea. Su trabajo colaborativo profundiza en el uso del aprendizaje automático para descubrir las 'visitas ocultas' que hacemos, esos viajes que no aparecen en los datos de telecomunicaciones estándar porque no estamos usando nuestros teléfonos lo suficiente.

El estudio, titulado ** Identificación de visitas ocultas de datos de registro de detalles de llamadas escasas **, es encabezado por Zhan Zhao de la Universidad de Hong Kong, junto a Haris N. Koutsopoulos de la Universidad Noreste de Boston, y Jinhua Zhao de MIT. Su objetivo? Para aprovechar los registros de conectividad móvil, como datos móviles, SMS y llamadas de voz, desde usuarios altamente activos para modelar y predecir los patrones de movimiento de aquellos que usan sus teléfonos con menos frecuencia.

Un esquema aproximado para extraer información de viaje de los datos del registro de detalles de llamadas (CD). Fuente: https://arxiv.org/pdf/2106.12885.pdf * Un esquema aproximado para extraer información de viaje de los datos del registro de detalles de llamadas (CD).* Fuente: https://arxiv.org/pdf/2106.12885.pdf

Si bien el equipo reconoce que la privacidad potencial se refiere a su trabajo, enfatizan que su objetivo es obtener una comprensión más generalizada de los patrones de movimiento, en lugar de ampliar los viajes individuales. También señalan que los datos del registro de detalles de llamadas (CDR), que es la columna vertebral de tales estudios, tiene sus limitaciones. A menudo es bajo en resolución espacial y susceptible a 'posicionar el ruido' debido a la posición cambiante del usuario en relación con las torres de teléfonos celulares. Sin embargo, argumentan que esta inexactitud en realidad sirve como una salvaguardia de privacidad:

** 'La aplicación objetivo de nuestro estudio es la detección de viajes y la estimación de OD \ [\*\], que se realizan a nivel agregado, no a nivel individual. Los modelos desarrollados se pueden implementar directamente en los servidores de bases de datos de los portadores de telecomunicaciones, sin necesidad de transferencia de datos. Además, en comparación con otras formas de big data, como los datos de las redes sociales o la transacción de tarjetas de crédito, los datos de CDR son relativamente menos intrusivos en términos de privacidad personal. Además, su error de localización ayuda a enmascarar las ubicaciones exactas de los usuarios, proporcionando otra capa de preservación de la privacidad. '**

Intervalos de tiempo transcurridos (ETIS)

Cuando estamos en movimiento con nuestros teléfonos móviles, no necesariamente los teléfonos inteligentes, las limitaciones de los datos CDR como herramienta para señalar nuestra ubicación se vuelven claras. Los intervalos de tiempo transcurridos (ETIS), esos períodos durante un viaje donde no hacemos ni recibimos llamadas, son marcadores cruciales para rastrear nuestros movimientos. Estos intervalos de 'silencio' pueden hacernos desaparecer temporalmente de la cuadrícula.

Los investigadores destacan cómo estas brechas interfieren con los sistemas analíticos que intentan dar sentido a los viajes de A> B. La escasez de datos podría estar ocultando un 'viaje no observado'. Su nuevo método aborda esto analizando el contexto espacio -temporal de ETI y considerando 'las características individuales del usuario'.

Conjunto de datos

Para construir su conjunto de capacitación central, los investigadores utilizaron datos de un importante operador de servicio celular en una ciudad china con una población de 6 millones. Este conjunto de datos incluyó más de dos mil millones de transacciones de teléfonos móviles de tres millones de usuarios en noviembre de 2013, centrándose únicamente en llamadas de voz y registros de acceso a datos. En particular, no incluían datos de SMS, que se sumaron al desafío de tratar con datos escasos.

Los datos incluyeron una ID única cifrada, un código de área de ubicación (LAC), una marca de tiempo, una ID de teléfono celular vinculada al LAC para identificar la torre de teléfono celular específica involucrada en la transacción y una ID de evento que indica si se trataba de una llamada o uso de datos saliente/entrante.

Árbol de proceso para la identificación de visitas ocultas. *Árbol de proceso para la identificación de visitas ocultas.*

Esta información se realizó con una base de datos de operación de la torre de celdas, lo que permite a los investigadores identificar las coordenadas de longitud y latitud de la torre asociada con cada evento de comunicación. Identificaron 9000 torres celulares dentro del conjunto de datos.

Los investigadores notaron la dificultad para adivinar con precisión los destinos de viaje basados ​​únicamente en los registros de llamadas, ya que estos registros alcanzan su punto máximo en la mañana y la tarde, lo que se alinea con los patrones de viaje típicos. Dado que las llamadas telefónicas pueden preceder a un viaje e incluso pueden activarlo, esto puede sesgar la estimación de destino.

Patrones de uso móvil en el transcurso de un día.*Patrones de uso móvil en el transcurso de un día.*

Desafíos similares surgen con el uso de datos iniciado por el usuario, como las aplicaciones de mensajería. Sin embargo, es el uso de datos 'automatizado', como la encuesta sistemática de API para nuevos mensajes u otros datos, incluidos los GPS y la telemetría en las aplicaciones, eso ayuda a identificar estos movimientos ocultos.

Tratamiento

Los investigadores emplearon una variedad de clasificadores de aprendizaje automático para abordar este problema, incluida la regresión logística, las máquinas de vectores de apoyo (SVM), los bosques aleatorios y un enfoque de conjunto de impulso de gradiente. Estos se implementaron en Python usando Scikit-Learn con configuración predeterminada.

Entre estos, la regresión logística proporcionó los parámetros del modelo más interpretables. El equipo también encontró que ETI más larga aumentó la probabilidad de que ocurra una visita oculta, con una mayor incidencia en la mañana. Por el contrario, cuando los datos CDR de un usuario mostraron claramente una gran cantidad de destinos o puntos de referencia, la probabilidad de una visita oculta fue menor. Este hallazgo respalda el principio central de su investigación: que los usuarios más activos proporcionan una imagen detallada de sus movimientos, de la cual se puede inferir el comportamiento de los usuarios menos activos.

En su conclusión, los investigadores sugieren que su enfoque podría aplicarse a otros tipos de datos de tránsito, como datos de tarjetas inteligentes e información de redes sociales geográficas.

La investigación fue apoyada por la financiación de Energy Foundation China y el Centro de Transporte Sostenible de China.

* \* Origen-Destination*

Artículo relacionado
“退化”合成面可能会增强面部识别技术 “退化”合成面可能会增强面部识别技术 密歇根州立大学的研究人员提出了一种创新的方式,将合成面孔用于崇高的原因 - 增强图像识别系统的准确性。这些合成面无代替导致深层现象的贡献
DeepSeek的AIS发现了真正的人类欲望 DeepSeek的AIS发现了真正的人类欲望 DeepSeek在AI奖励模型中的突破性:加强AI推理和响应中国AI初创公司DeepSeek与Tsinghua University合作,在AI研究中取得了重要的里程碑。他们对AI奖励模型的创新方法有望彻底改变AI系统的学习方式
DeepCoder通过14B开放模型实现高编码效率 DeepCoder通过14B开放模型实现高编码效率 介绍DeepCoder-14b:开源编码模型的新领域,AI和Agentica的团队揭幕了DeepCoder-14b,这是一种开创性的编码模型,与Openai的O3-Mini(例如Openai的O3-Mini)肩并肩。这种令人兴奋的发展是基于FO的
Comentario (10)
0/200
BrianWalker 23 de abril de 2025 10:37:03 GMT

This study on tracking hidden visits with cell phone data and ML is mind-blowing 🤯 It's cool to see how researchers from different countries are teaming up to uncover these patterns. But it's also a bit creepy knowing our movements can be tracked so easily. Still, super interesting and definitely worth a read! 📚

BenHernández 23 de abril de 2025 10:37:03 GMT

携帯電話データと機械学習を使って隠れた訪問を追跡するこの研究は驚きです🤯 異なる国の研究者が協力してこれらのパターンを明らかにしているのはクールです。でも、私たちの移動がこんなに簡単に追跡されるのはちょっと気味悪いです。でも、とても興味深くて読む価値があります!📚

HarryLewis 23 de abril de 2025 10:37:03 GMT

휴대전화 데이터와 머신러닝으로 숨겨진 방문을 추적하는 이 연구는 정말 놀랍네요 🤯 다른 나라의 연구자들이 협력해서 이런 패턴을 밝히는 건 멋지죠. 하지만 우리의 이동이 이렇게 쉽게 추적된다는 게 조금 섬뜩하기도 해요. 그래도 정말 흥미롭고 읽을 가치가 있어요! 📚

JasonMartin 23 de abril de 2025 10:37:03 GMT

Este estudo sobre o rastreamento de visitas ocultas com dados de celular e ML é impressionante 🤯 É legal ver como pesquisadores de diferentes países estão colaborando para descobrir esses padrões. Mas também é um pouco assustador saber que nossos movimentos podem ser rastreados tão facilmente. Ainda assim, muito interessante e vale a pena ler! 📚

RaymondRodriguez 23 de abril de 2025 10:37:03 GMT

Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚

SamuelClark 23 de abril de 2025 07:52:14 GMT

This study on 'hidden visits' using cell phone data and machine learning is mind-blowing! It's fascinating how they can track movements so accurately. But it's also a bit creepy, isn't it? 🤔📱

OR