Lar Notícias Descobrindo nossas 'visitas ocultas' com dados de telefone celular e aprendizado de máquina

Descobrindo nossas 'visitas ocultas' com dados de telefone celular e aprendizado de máquina

22 de Abril de 2025
JustinScott
0

Se você já se perguntou como os pesquisadores rastreiam nossos movimentos em um país sem depender apenas de telefonemas, um estudo fascinante de pesquisadores da China e dos Estados Unidos oferece alguma visão. Seu trabalho colaborativo investiga o uso do aprendizado de máquina para descobrir as 'visitas ocultas' que fazemos - aquelas viagens que não aparecem nos dados padrão de telecomunicações porque não estamos usando nossos telefones o suficiente.

O estudo, intitulado ** Identificando as visitas ocultas de dados de registro de detalhes de chamada escassa **, é liderado por Zhan Zhao pela Universidade de Hong Kong, ao lado de Haris N. Koutsopoulos, da Northeastern University, em Boston, e Jinhua Zhao, do MIT. Seu objetivo? Para alavancar os registros de conectividade móvel - como dados móveis, SMS e chamadas de voz - de usuários altamente ativos para modelar e prever os padrões de movimento daqueles que usam seus telefones com menos frequência.

Um esquema aproximado para extrair informações de viagem dos dados de registro de detalhes de chamada (CD). Fonte: https://arxiv.org/pdf/2106.12885.pdf * Um esquema aproximado para extrair informações de viagem dos dados do registro de detalhes da chamada (CD).* Fonte: https://arxiv.org/pdf/2106.12885.pdf

Embora a equipe reconheça que o potencial privacidade diz respeito ao seu trabalho, eles enfatizam que seu objetivo é obter uma compreensão mais generalizada dos padrões de movimento, em vez de aumentar o zoom em jornadas individuais. Eles também apontam que os dados de registro de detalhes de chamada (CDR), que é a espinha dorsal de tais estudos, têm suas limitações. Muitas vezes, é baixo em resolução espacial e suscetível ao 'ruído de posicionamento' devido à posição de mudança do usuário em relação às torres de telefone celular. No entanto, eles argumentam que essa imprecisão realmente serve como uma salvaguarda de privacidade:

** 'A aplicação alvo do nosso estudo é a detecção de viagem e a estimativa de OD \ [\*\], que são feitas no nível agregado, não no nível individual. Os modelos desenvolvidos podem ser implantados diretamente nos servidores de banco de dados de operadoras de telecomunicações, sem a necessidade de transferência de dados. Além disso, em comparação com outras formas de big data, como dados de transação de mídia social ou cartão de crédito, os dados de CDR são relativamente menos intrusivos em termos de privacidade pessoal. Além disso, seu erro de localização ajuda a mascarar os locais exatos do usuário, fornecendo outra camada de preservação da privacidade. '**

Intervalos de tempo decorridos (ETIS)

Quando estamos em movimento com nossos telefones celulares, não necessariamente smartphones, as limitações dos dados CDR como uma ferramenta para identificar nossa localização ficam claras. Intervalos de tempo decorridos (ETIS), esses períodos durante uma jornada em que não fazemos ou recebemos chamadas, são marcadores cruciais para rastrear nossos movimentos. Esses intervalos de 'silêncio' podem nos fazer desaparecer temporariamente da grade.

Os pesquisadores destacam como essas lacunas interferem nos sistemas analíticos tentando entender as viagens A> B. A escassez de dados pode estar escondendo uma 'viagem não observada'. Seu novo método aborda isso analisando o contexto espaço -temporal do ETIS e considerando 'as características individuais do usuário'.

Conjunto de dados

Para construir seu principal conjunto de treinamento, os pesquisadores usaram dados de um grande operador de serviço celular em uma cidade chinesa com uma população de 6 milhões. Esse conjunto de dados incluiu mais de dois bilhões de transações de telefonia móvel de três milhões de usuários em novembro de 2013, concentrando -se apenas em chamadas de voz e registros de acesso a dados. Notavelmente, eles não incluíram dados de SMS, o que aumentou o desafio de lidar com dados esparsos.

Os dados incluíram um ID exclusivo criptografado, um código de área de localização (LAC), um registro de data e hora, um ID de telefone celular vinculado ao LAC para identificar a torre específica do telefone celular envolvida na transação e um ID de evento indicando se foi uma chamada de saída/recebimento ou uso de dados.

Árvore de processo para a identificação de visitas ocultas. *Processar árvore para a identificação de visitas ocultas.*

Essas informações foram referenciadas cruzadas com um banco de dados de operação da torre de celular, permitindo que os pesquisadores identifiquem as coordenadas de longitude e latitude da torre associada a cada evento de comunicação. Eles identificaram 9000 torres celulares dentro do conjunto de dados.

Os pesquisadores observaram a dificuldade em adivinhar os destinos de viagem com precisão baseados apenas nos registros de chamadas, pois esses registros atingem o pico de manhã e tarde, que se alinham aos padrões típicos de viagem. Como as chamadas telefônicas podem preceder uma jornada e podem até desencadeá -la, isso pode distorcer a estimativa de destino.

Padrões de uso móvel ao longo de um dia. *Padrões de uso móvel ao longo de um dia.*

Desafios semelhantes surgem com o uso de dados iniciados pelo usuário, como aplicativos de mensagens. No entanto, é o uso de dados 'automatizado' - como a pesquisa sistemática de APIs para novas mensagens ou outros dados, incluindo GPS e telemetria entre aplicativos - que ajuda a identificar esses movimentos ocultos.

Processamento

Os pesquisadores empregaram uma variedade de classificadores de aprendizado de máquina para resolver esse problema, incluindo regressão logística, máquinas vetoriais de suporte (SVM), florestas aleatórias e uma abordagem de gradiente de impulso. Estes foram implementados em Python usando o Scikit-Learn com configurações padrão.

Entre eles, a regressão logística forneceu os parâmetros de modelo mais interpretáveis. A equipe também descobriu que o Etis mais longo aumentou a probabilidade de ocorrer uma visita oculta, com uma maior incidência de manhã. Por outro lado, quando os dados de CDR de um usuário mostraram claramente um alto número de destinos ou waypoints, a probabilidade de uma visita oculta foi menor. Essa descoberta suporta o princípio central de suas pesquisas - que os usuários mais ativos fornecem uma imagem detalhada de seus movimentos, dos quais o comportamento de usuários menos ativos pode ser inferido.

Em sua conclusão, os pesquisadores sugerem que sua abordagem pode ser aplicada a outros tipos de dados de trânsito, como dados de cartões inteligentes e informações de mídia social localizadas com geo.

A pesquisa foi apoiada pelo financiamento da Energy Foundation China e do Centro de Transporte Sustentável da China.

* \* Origin-Destination*

Artigo relacionado
Os rostos sintéticos 'degradados' podem melhorar a tecnologia de reconhecimento facial Os rostos sintéticos 'degradados' podem melhorar a tecnologia de reconhecimento facial Pesquisadores da Universidade Estadual de Michigan criaram uma maneira inovadora de usar rostos sintéticos por uma causa nobre - aprimorando a precisão dos sistemas de reconhecimento de imagens. Em vez de contribuir para o fenômeno de DeepFakes, esses rostos sintéticos são projetados para imitar as imperfeições encontradas na verdade
O AIS de Deepseek descobre desejos humanos verdadeiros O AIS de Deepseek descobre desejos humanos verdadeiros O avanço de Deepseek nos modelos de recompensa da IA: melhorar o raciocínio e a resposta da IA ​​Startup Chinês Deepseek, em colaboração com a Universidade de Tsinghua, alcançou um marco significativo na pesquisa de IA. Sua abordagem inovadora para os modelos de recompensa da IA ​​promete revolucionar como os sistemas de IA aprendem
Deepcoder alcança a alta eficiência de codificação com o modelo aberto 14B Deepcoder alcança a alta eficiência de codificação com o modelo aberto 14B Apresentando o DeepCoder-14b: Uma nova fronteira em modelos de codificação de código aberto. Este desenvolvimento emocionante é construído no FO
Comentários (10)
0/200
BrianWalker 23 de Abril de 2025 à3 10:37:03 GMT

This study on tracking hidden visits with cell phone data and ML is mind-blowing 🤯 It's cool to see how researchers from different countries are teaming up to uncover these patterns. But it's also a bit creepy knowing our movements can be tracked so easily. Still, super interesting and definitely worth a read! 📚

BenHernández 23 de Abril de 2025 à3 10:37:03 GMT

携帯電話データと機械学習を使って隠れた訪問を追跡するこの研究は驚きです🤯 異なる国の研究者が協力してこれらのパターンを明らかにしているのはクールです。でも、私たちの移動がこんなに簡単に追跡されるのはちょっと気味悪いです。でも、とても興味深くて読む価値があります!📚

HarryLewis 23 de Abril de 2025 à3 10:37:03 GMT

휴대전화 데이터와 머신러닝으로 숨겨진 방문을 추적하는 이 연구는 정말 놀랍네요 🤯 다른 나라의 연구자들이 협력해서 이런 패턴을 밝히는 건 멋지죠. 하지만 우리의 이동이 이렇게 쉽게 추적된다는 게 조금 섬뜩하기도 해요. 그래도 정말 흥미롭고 읽을 가치가 있어요! 📚

JasonMartin 23 de Abril de 2025 à3 10:37:03 GMT

Este estudo sobre o rastreamento de visitas ocultas com dados de celular e ML é impressionante 🤯 É legal ver como pesquisadores de diferentes países estão colaborando para descobrir esses padrões. Mas também é um pouco assustador saber que nossos movimentos podem ser rastreados tão facilmente. Ainda assim, muito interessante e vale a pena ler! 📚

RaymondRodriguez 23 de Abril de 2025 à3 10:37:03 GMT

Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚

SamuelClark 23 de Abril de 2025 à14 07:52:14 GMT

This study on 'hidden visits' using cell phone data and machine learning is mind-blowing! It's fascinating how they can track movements so accurately. But it's also a bit creepy, isn't it? 🤔📱

OR