Descobrindo nossas 'visitas ocultas' com dados de telefone celular e aprendizado de máquina
Se você já se perguntou como os pesquisadores rastreiam nossos movimentos em um país sem depender apenas de telefonemas, um estudo fascinante de pesquisadores da China e dos Estados Unidos oferece alguma visão. Seu trabalho colaborativo investiga o uso do aprendizado de máquina para descobrir as 'visitas ocultas' que fazemos - aquelas viagens que não aparecem nos dados padrão de telecomunicações porque não estamos usando nossos telefones o suficiente.
O estudo, intitulado ** Identificando as visitas ocultas de dados de registro de detalhes de chamada escassa **, é liderado por Zhan Zhao pela Universidade de Hong Kong, ao lado de Haris N. Koutsopoulos, da Northeastern University, em Boston, e Jinhua Zhao, do MIT. Seu objetivo? Para alavancar os registros de conectividade móvel - como dados móveis, SMS e chamadas de voz - de usuários altamente ativos para modelar e prever os padrões de movimento daqueles que usam seus telefones com menos frequência.
* Um esquema aproximado para extrair informações de viagem dos dados do registro de detalhes da chamada (CD).* Fonte: https://arxiv.org/pdf/2106.12885.pdf
Embora a equipe reconheça que o potencial privacidade diz respeito ao seu trabalho, eles enfatizam que seu objetivo é obter uma compreensão mais generalizada dos padrões de movimento, em vez de aumentar o zoom em jornadas individuais. Eles também apontam que os dados de registro de detalhes de chamada (CDR), que é a espinha dorsal de tais estudos, têm suas limitações. Muitas vezes, é baixo em resolução espacial e suscetível ao 'ruído de posicionamento' devido à posição de mudança do usuário em relação às torres de telefone celular. No entanto, eles argumentam que essa imprecisão realmente serve como uma salvaguarda de privacidade:
** 'A aplicação alvo do nosso estudo é a detecção de viagem e a estimativa de OD \ [\*\], que são feitas no nível agregado, não no nível individual. Os modelos desenvolvidos podem ser implantados diretamente nos servidores de banco de dados de operadoras de telecomunicações, sem a necessidade de transferência de dados. Além disso, em comparação com outras formas de big data, como dados de transação de mídia social ou cartão de crédito, os dados de CDR são relativamente menos intrusivos em termos de privacidade pessoal. Além disso, seu erro de localização ajuda a mascarar os locais exatos do usuário, fornecendo outra camada de preservação da privacidade. '**
Intervalos de tempo decorridos (ETIS)
Quando estamos em movimento com nossos telefones celulares, não necessariamente smartphones, as limitações dos dados CDR como uma ferramenta para identificar nossa localização ficam claras. Intervalos de tempo decorridos (ETIS), esses períodos durante uma jornada em que não fazemos ou recebemos chamadas, são marcadores cruciais para rastrear nossos movimentos. Esses intervalos de 'silêncio' podem nos fazer desaparecer temporariamente da grade.
Os pesquisadores destacam como essas lacunas interferem nos sistemas analíticos tentando entender as viagens A> B. A escassez de dados pode estar escondendo uma 'viagem não observada'. Seu novo método aborda isso analisando o contexto espaço -temporal do ETIS e considerando 'as características individuais do usuário'.
Conjunto de dados
Para construir seu principal conjunto de treinamento, os pesquisadores usaram dados de um grande operador de serviço celular em uma cidade chinesa com uma população de 6 milhões. Esse conjunto de dados incluiu mais de dois bilhões de transações de telefonia móvel de três milhões de usuários em novembro de 2013, concentrando -se apenas em chamadas de voz e registros de acesso a dados. Notavelmente, eles não incluíram dados de SMS, o que aumentou o desafio de lidar com dados esparsos.
Os dados incluíram um ID exclusivo criptografado, um código de área de localização (LAC), um registro de data e hora, um ID de telefone celular vinculado ao LAC para identificar a torre específica do telefone celular envolvida na transação e um ID de evento indicando se foi uma chamada de saída/recebimento ou uso de dados.
*Processar árvore para a identificação de visitas ocultas.*
Essas informações foram referenciadas cruzadas com um banco de dados de operação da torre de celular, permitindo que os pesquisadores identifiquem as coordenadas de longitude e latitude da torre associada a cada evento de comunicação. Eles identificaram 9000 torres celulares dentro do conjunto de dados.
Os pesquisadores observaram a dificuldade em adivinhar os destinos de viagem com precisão baseados apenas nos registros de chamadas, pois esses registros atingem o pico de manhã e tarde, que se alinham aos padrões típicos de viagem. Como as chamadas telefônicas podem preceder uma jornada e podem até desencadeá -la, isso pode distorcer a estimativa de destino.
*Padrões de uso móvel ao longo de um dia.*
Desafios semelhantes surgem com o uso de dados iniciados pelo usuário, como aplicativos de mensagens. No entanto, é o uso de dados 'automatizado' - como a pesquisa sistemática de APIs para novas mensagens ou outros dados, incluindo GPS e telemetria entre aplicativos - que ajuda a identificar esses movimentos ocultos.
Processamento
Os pesquisadores empregaram uma variedade de classificadores de aprendizado de máquina para resolver esse problema, incluindo regressão logística, máquinas vetoriais de suporte (SVM), florestas aleatórias e uma abordagem de gradiente de impulso. Estes foram implementados em Python usando o Scikit-Learn com configurações padrão.
Entre eles, a regressão logística forneceu os parâmetros de modelo mais interpretáveis. A equipe também descobriu que o Etis mais longo aumentou a probabilidade de ocorrer uma visita oculta, com uma maior incidência de manhã. Por outro lado, quando os dados de CDR de um usuário mostraram claramente um alto número de destinos ou waypoints, a probabilidade de uma visita oculta foi menor. Essa descoberta suporta o princípio central de suas pesquisas - que os usuários mais ativos fornecem uma imagem detalhada de seus movimentos, dos quais o comportamento de usuários menos ativos pode ser inferido.
Em sua conclusão, os pesquisadores sugerem que sua abordagem pode ser aplicada a outros tipos de dados de trânsito, como dados de cartões inteligentes e informações de mídia social localizadas com geo.
A pesquisa foi apoiada pelo financiamento da Energy Foundation China e do Centro de Transporte Sustentável da China.
* \* Origin-Destination*
Artigo relacionado
低コストな拡張現実向けの本格的なフォーカシングシステム
投影型拡張現実の革命著名な電気電子学会(IEEE)の研究者たちは、投影型拡張現実の世界において画期的な進展を遂げました。彼らの解決策とは、視覚的に深さを感じさせるために人間の目と同じように動作する電気的にフォーカス調整可能なレンズ(ETL)を搭載した特殊な眼鏡です。この革新的なアプローチは、投影システムを制御された環境で本当に実用的なものにするための大きな障
AIを使用して都市が極端な暑さに取り組むのを支援する方法
2024年は、2023年を超えて、最も暑い年の記録を破るだけかもしれません。この傾向は、都市の熱島に住んでいる人々にとって特に難しいです。コンクリートとアスファルトが太陽の光を吸収し、その後熱を放射する都市の斑点です。これらの領域は暖めることができます
「分解された」合成面は、顔認識技術を強化する可能性があります
ミシガン州立大学の研究者は、画像認識システムの精度を強化するために、高貴な大義のために合成面を使用する革新的な方法を思いつきました。ディープフェイクの現象に貢献する代わりに、これらの合成面は、現実に見られる欠陥を模倣するように設計されています。
Comentários (15)
0/200
BrianWalker
23 de Abril de 2025 à0 00:00:00 GMT
This study on tracking hidden visits with cell phone data and ML is mind-blowing 🤯 It's cool to see how researchers from different countries are teaming up to uncover these patterns. But it's also a bit creepy knowing our movements can be tracked so easily. Still, super interesting and definitely worth a read! 📚
0
BenHernández
23 de Abril de 2025 à0 00:00:00 GMT
携帯電話データと機械学習を使って隠れた訪問を追跡するこの研究は驚きです🤯 異なる国の研究者が協力してこれらのパターンを明らかにしているのはクールです。でも、私たちの移動がこんなに簡単に追跡されるのはちょっと気味悪いです。でも、とても興味深くて読む価値があります!📚
0
HarryLewis
23 de Abril de 2025 à0 00:00:00 GMT
휴대전화 데이터와 머신러닝으로 숨겨진 방문을 추적하는 이 연구는 정말 놀랍네요 🤯 다른 나라의 연구자들이 협력해서 이런 패턴을 밝히는 건 멋지죠. 하지만 우리의 이동이 이렇게 쉽게 추적된다는 게 조금 섬뜩하기도 해요. 그래도 정말 흥미롭고 읽을 가치가 있어요! 📚
0
JasonMartin
23 de Abril de 2025 à0 00:00:00 GMT
Este estudo sobre o rastreamento de visitas ocultas com dados de celular e ML é impressionante 🤯 É legal ver como pesquisadores de diferentes países estão colaborando para descobrir esses padrões. Mas também é um pouco assustador saber que nossos movimentos podem ser rastreados tão facilmente. Ainda assim, muito interessante e vale a pena ler! 📚
0
RaymondRodriguez
23 de Abril de 2025 à0 00:00:00 GMT
Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚
0
SamuelClark
23 de Abril de 2025 à0 00:00:00 GMT
This study on 'hidden visits' using cell phone data and machine learning is mind-blowing! It's fascinating how they can track movements so accurately. But it's also a bit creepy, isn't it? 🤔📱
0
Se você já se perguntou como os pesquisadores rastreiam nossos movimentos em um país sem depender apenas de telefonemas, um estudo fascinante de pesquisadores da China e dos Estados Unidos oferece alguma visão. Seu trabalho colaborativo investiga o uso do aprendizado de máquina para descobrir as 'visitas ocultas' que fazemos - aquelas viagens que não aparecem nos dados padrão de telecomunicações porque não estamos usando nossos telefones o suficiente.
O estudo, intitulado ** Identificando as visitas ocultas de dados de registro de detalhes de chamada escassa **, é liderado por Zhan Zhao pela Universidade de Hong Kong, ao lado de Haris N. Koutsopoulos, da Northeastern University, em Boston, e Jinhua Zhao, do MIT. Seu objetivo? Para alavancar os registros de conectividade móvel - como dados móveis, SMS e chamadas de voz - de usuários altamente ativos para modelar e prever os padrões de movimento daqueles que usam seus telefones com menos frequência.
* Um esquema aproximado para extrair informações de viagem dos dados do registro de detalhes da chamada (CD).* Fonte: https://arxiv.org/pdf/2106.12885.pdf
Embora a equipe reconheça que o potencial privacidade diz respeito ao seu trabalho, eles enfatizam que seu objetivo é obter uma compreensão mais generalizada dos padrões de movimento, em vez de aumentar o zoom em jornadas individuais. Eles também apontam que os dados de registro de detalhes de chamada (CDR), que é a espinha dorsal de tais estudos, têm suas limitações. Muitas vezes, é baixo em resolução espacial e suscetível ao 'ruído de posicionamento' devido à posição de mudança do usuário em relação às torres de telefone celular. No entanto, eles argumentam que essa imprecisão realmente serve como uma salvaguarda de privacidade:
** 'A aplicação alvo do nosso estudo é a detecção de viagem e a estimativa de OD \ [\*\], que são feitas no nível agregado, não no nível individual. Os modelos desenvolvidos podem ser implantados diretamente nos servidores de banco de dados de operadoras de telecomunicações, sem a necessidade de transferência de dados. Além disso, em comparação com outras formas de big data, como dados de transação de mídia social ou cartão de crédito, os dados de CDR são relativamente menos intrusivos em termos de privacidade pessoal. Além disso, seu erro de localização ajuda a mascarar os locais exatos do usuário, fornecendo outra camada de preservação da privacidade. '**
Intervalos de tempo decorridos (ETIS)
Quando estamos em movimento com nossos telefones celulares, não necessariamente smartphones, as limitações dos dados CDR como uma ferramenta para identificar nossa localização ficam claras. Intervalos de tempo decorridos (ETIS), esses períodos durante uma jornada em que não fazemos ou recebemos chamadas, são marcadores cruciais para rastrear nossos movimentos. Esses intervalos de 'silêncio' podem nos fazer desaparecer temporariamente da grade.
Os pesquisadores destacam como essas lacunas interferem nos sistemas analíticos tentando entender as viagens A> B. A escassez de dados pode estar escondendo uma 'viagem não observada'. Seu novo método aborda isso analisando o contexto espaço -temporal do ETIS e considerando 'as características individuais do usuário'.
Conjunto de dados
Para construir seu principal conjunto de treinamento, os pesquisadores usaram dados de um grande operador de serviço celular em uma cidade chinesa com uma população de 6 milhões. Esse conjunto de dados incluiu mais de dois bilhões de transações de telefonia móvel de três milhões de usuários em novembro de 2013, concentrando -se apenas em chamadas de voz e registros de acesso a dados. Notavelmente, eles não incluíram dados de SMS, o que aumentou o desafio de lidar com dados esparsos.
Os dados incluíram um ID exclusivo criptografado, um código de área de localização (LAC), um registro de data e hora, um ID de telefone celular vinculado ao LAC para identificar a torre específica do telefone celular envolvida na transação e um ID de evento indicando se foi uma chamada de saída/recebimento ou uso de dados.
*Processar árvore para a identificação de visitas ocultas.*
Essas informações foram referenciadas cruzadas com um banco de dados de operação da torre de celular, permitindo que os pesquisadores identifiquem as coordenadas de longitude e latitude da torre associada a cada evento de comunicação. Eles identificaram 9000 torres celulares dentro do conjunto de dados.
Os pesquisadores observaram a dificuldade em adivinhar os destinos de viagem com precisão baseados apenas nos registros de chamadas, pois esses registros atingem o pico de manhã e tarde, que se alinham aos padrões típicos de viagem. Como as chamadas telefônicas podem preceder uma jornada e podem até desencadeá -la, isso pode distorcer a estimativa de destino.
*Padrões de uso móvel ao longo de um dia.*
Desafios semelhantes surgem com o uso de dados iniciados pelo usuário, como aplicativos de mensagens. No entanto, é o uso de dados 'automatizado' - como a pesquisa sistemática de APIs para novas mensagens ou outros dados, incluindo GPS e telemetria entre aplicativos - que ajuda a identificar esses movimentos ocultos.
Processamento
Os pesquisadores empregaram uma variedade de classificadores de aprendizado de máquina para resolver esse problema, incluindo regressão logística, máquinas vetoriais de suporte (SVM), florestas aleatórias e uma abordagem de gradiente de impulso. Estes foram implementados em Python usando o Scikit-Learn com configurações padrão.
Entre eles, a regressão logística forneceu os parâmetros de modelo mais interpretáveis. A equipe também descobriu que o Etis mais longo aumentou a probabilidade de ocorrer uma visita oculta, com uma maior incidência de manhã. Por outro lado, quando os dados de CDR de um usuário mostraram claramente um alto número de destinos ou waypoints, a probabilidade de uma visita oculta foi menor. Essa descoberta suporta o princípio central de suas pesquisas - que os usuários mais ativos fornecem uma imagem detalhada de seus movimentos, dos quais o comportamento de usuários menos ativos pode ser inferido.
Em sua conclusão, os pesquisadores sugerem que sua abordagem pode ser aplicada a outros tipos de dados de trânsito, como dados de cartões inteligentes e informações de mídia social localizadas com geo.
A pesquisa foi apoiada pelo financiamento da Energy Foundation China e do Centro de Transporte Sustentável da China.
* \* Origin-Destination*




This study on tracking hidden visits with cell phone data and ML is mind-blowing 🤯 It's cool to see how researchers from different countries are teaming up to uncover these patterns. But it's also a bit creepy knowing our movements can be tracked so easily. Still, super interesting and definitely worth a read! 📚




携帯電話データと機械学習を使って隠れた訪問を追跡するこの研究は驚きです🤯 異なる国の研究者が協力してこれらのパターンを明らかにしているのはクールです。でも、私たちの移動がこんなに簡単に追跡されるのはちょっと気味悪いです。でも、とても興味深くて読む価値があります!📚




휴대전화 데이터와 머신러닝으로 숨겨진 방문을 추적하는 이 연구는 정말 놀랍네요 🤯 다른 나라의 연구자들이 협력해서 이런 패턴을 밝히는 건 멋지죠. 하지만 우리의 이동이 이렇게 쉽게 추적된다는 게 조금 섬뜩하기도 해요. 그래도 정말 흥미롭고 읽을 가치가 있어요! 📚




Este estudo sobre o rastreamento de visitas ocultas com dados de celular e ML é impressionante 🤯 É legal ver como pesquisadores de diferentes países estão colaborando para descobrir esses padrões. Mas também é um pouco assustador saber que nossos movimentos podem ser rastreados tão facilmente. Ainda assim, muito interessante e vale a pena ler! 📚




Este estudio sobre el seguimiento de visitas ocultas con datos de celulares y ML es alucinante 🤯 Es genial ver cómo investigadores de diferentes países están colaborando para descubrir estos patrones. Pero también es un poco escalofriante saber que nuestros movimientos pueden ser rastreados tan fácilmente. Aún así, muy interesante y definitivamente vale la pena leerlo! 📚




This study on 'hidden visits' using cell phone data and machine learning is mind-blowing! It's fascinating how they can track movements so accurately. But it's also a bit creepy, isn't it? 🤔📱












