使用手機數據和機器學習探索我們的“隱藏訪問”
如果您曾經好奇研究人員如何在不完全依賴電話通話的情況下追蹤我們在全國的移動,一項由來自中國和美國的研究人員進行的引人入勝研究提供了一些見解。他們的合作研究深入探討了使用機器學習來揭示我們所進行的「隱藏訪問」——那些由於我們使用電話不夠頻繁而未出現在標準電信數據中的行程。
這項研究題為**從稀疏通話詳情記錄數據中識別隱藏訪問**,由香港大學的趙展帶領,聯合波士頓東北大學的Haris N. Koutsopoulos和麻省理工學院的趙金華進行。他們的目標是利用高活躍用戶的移動連接記錄——如移動數據、短信和語音通話——來建模並預測那些較少使用電話的用戶的移動模式。
*從通話詳情記錄(CD)數據中提取行程資訊的粗略示意圖。* 來源:https://arxiv.org/pdf/2106.12885.pdf
雖然研究團隊承認他們的工作可能引發隱私問題,但他們強調其目標是獲得對移動模式的更廣泛理解,而不是聚焦於個人行程。他們還指出,通話詳情記錄(CDR)數據作為此類研究的基礎有其局限性。其空間分辨率通常較低,且因用戶相對於手機信號塔位置的變化而容易受到「定位噪音」的影響。然而,他們認為這種不準確性實際上是一種隱私保護措施:
**「我們研究的目標應用是行程檢測和OD估計$$ \* $$,這些是在總體層面進行,而不是個體層面。開發的模型可以直接部署在電信運營商的數據庫伺服器上,無需數據傳輸。此外,與其他形式的大數據(如社交媒體或信用卡交易數據)相比,CDR數據在個人隱私方面的侵入性相對較低。此外,其定位誤差有助於掩蓋用戶的確切位置,提供了另一層隱私保護。」**
經過時間間隔(ETIs)
當我們攜帶手機(不一定是智能手機)移動時,CDR數據作為精確定位工具的局限性顯而易見。經過時間間隔(ETIs),即旅途中我們未撥打或接收電話的時間段,是追蹤我們移動的關鍵標記。這些「沉默」間隔可能使我們暫時從數據網格中消失。
研究人員強調這些間隔如何干擾試圖理解A>B行程的分析系統。數據的稀疏性可能隱藏了「未觀察到的行程」。他們的新方法通過分析ETIs的時空背景並考慮「用戶的個人特徵」來解決這個問題。
數據集
為了構建核心訓練集,研究人員使用了來自中國一個600萬人口城市的主要移動服務運營商的數據。該數據集包括2013年11月300萬用戶的超過20億手機交易,僅聚焦於語音通話和數據訪問記錄。值得注意的是,他們未包含短信數據,這增加了處理稀疏數據的挑戰。
數據包括加密的唯一ID、位置區域碼(LAC)、時間戳、與LAC相關的手機信號塔ID(用於識別涉及交易的具體信號塔),以及表示是撥出/接收通話還是數據使用的活動ID。
*識別隱藏訪問的流程樹。*
這些資訊與信號塔運營數據庫交叉參考,使研究人員能夠確定與每個通信事件相關的信號塔的經度和緯度座標。他們在數據集中識別了9000個信號塔。
研究人員指出,僅基於通話記錄準確猜測行程目的地的難度,因為這些記錄在早晨和下午達到高峰,這與典型的旅行模式一致。由於電話通話可能在行程之前發生,甚至可能觸發行程,這可能會影響目的地估計的準確性。
*一天中手機使用模式的變化。*
用戶主動的數據使用(如消息應用程序)也面臨類似挑戰。然而,像是API系統性輪詢新消息或其他數據(包括應用程序中的GPS和遙測數據)的「自動化」數據使用,有助於識別這些隱藏移動。
處理
研究人員使用了多種機器學習分類器來解決這個問題,包括邏輯回歸、支持向量機(SVM)、隨機森林和梯度提升集成方法。這些分類器使用Python的scikit-learn以默認設置實現。
在這些方法中,邏輯回歸提供了最具可解釋性的模型參數。團隊還發現,較長的ETIs增加了發生隱藏訪問的可能性,尤其在早晨更為顯著。相反,當用戶的CDR數據清楚顯示出大量目的地或中途點時,隱藏訪問的可能性較低。這一發現支持了他們研究的核心原則——最活躍的用戶提供了詳細的移動圖景,從中可以推斷出較不活躍用戶的行為。
在結論中,研究人員建議他們的方法可以應用於其他類型的交通數據,如智能卡數據和地理定位的社交媒體資訊。
這項研究得到了中國能源基金會和中國可持續交通中心的資助。
*\* 起點-目的地*
相關文章
據報導,員工瀏覽了露骨內容,Meta 因此面臨關於 AI 眼鏡隱私問題的訴訟
Meta 正因旗下 AI 智慧眼鏡的隱私問題面臨新一波訴訟。根據瑞典報紙的調查,一家總部位於肯亞的分包商員工一直在審查客戶的影像資料。據報導,這些影像包含裸露、性行為以及如廁等敏感內容。Meta聲稱會對影像中的臉部進行模糊處理,但新聞報導援引消息來源指出,此舉並非總是能有效發揮作用。這項調查結果促使英國資訊專員辦公室展開調查。這家科技巨頭如今在美國也面臨法律訴訟。在這份新提交的訴狀中,由公益律師事
以優化為驅動的人工智慧,正成為通用的模型發展新途徑
伊利諾大學厄巴納-香檳分校與維吉尼亞大學的研究人員開發出一種新型模型架構,有望為具備更強推理能力且更具韌性的AI系統鋪平道路。名為「能量基變壓器」(EBT)的架構,能自然運用推論時間擴展性來解決複雜挑戰。對企業而言,這意味著能以成本效益方式部署人工智慧應用,無需專門調校模型即可適應新情境。系統二思維的挑戰在心理學中,人類認知通常分為兩種模式:快速直覺的系統一,以及較緩慢、更刻意且具分析性的系統二。
人工智慧熱潮引發網路泡沫時期的泡沫憂慮
數十億美元湧入人工智慧領域的投資熱潮,引發一場激烈辯論:該產業是否正走向網路泡沫式的泡沫?投資者正密切關注熱潮是否降溫,或巨額晶片與基礎建設支出未能帶來預期回報的跡象。美銀全球研究近期調查凸顯此種謹慎態度:54%基金經理人認為人工智慧股票已處泡沫期,38%持反對意見。與網路泡沫的相似之處儘管樂觀情緒蔓延,質疑者仍質疑人工智慧的實質影響力,部分人士更直指其為虛張聲勢或即將破裂的泡沫。思科亞太、日本及
相關專題推薦
評論 (20)
0/500
Die Studie zeigt echt spannend, wie sich Bewegungsmuster aus Mobilfunkdaten extrahieren lassen. Gleichzeitig wirft das aber auch Datenschutzfragen auf – wer kontrolliert eigentlich, wie diese Infos genutzt werden? 🧐
Wait, so they're using ML to track our 'hidden visits' now? 😅 Always feels a bit creepy when tech peeks into those unregistered trips... but the data insights could be huge for urban planning or disease tracking, right? Still, makes me side-eye my phone a little more today 🧐
This study on tracking movements with phone data is wild! 😲 It’s like our phones are secretly spilling where we’ve been. Kinda creepy, but super cool how machine learning digs into those 'hidden visits.' Makes me wonder what else they can find out!
This article blew my mind! Using phone data and ML to track hidden visits is so cool, but kinda creepy too. 🤯 Wonder how they balance privacy with all this tech wizardry.
如果您曾經好奇研究人員如何在不完全依賴電話通話的情況下追蹤我們在全國的移動,一項由來自中國和美國的研究人員進行的引人入勝研究提供了一些見解。他們的合作研究深入探討了使用機器學習來揭示我們所進行的「隱藏訪問」——那些由於我們使用電話不夠頻繁而未出現在標準電信數據中的行程。
這項研究題為**從稀疏通話詳情記錄數據中識別隱藏訪問**,由香港大學的趙展帶領,聯合波士頓東北大學的Haris N. Koutsopoulos和麻省理工學院的趙金華進行。他們的目標是利用高活躍用戶的移動連接記錄——如移動數據、短信和語音通話——來建模並預測那些較少使用電話的用戶的移動模式。
*從通話詳情記錄(CD)數據中提取行程資訊的粗略示意圖。* 來源:https://arxiv.org/pdf/2106.12885.pdf
雖然研究團隊承認他們的工作可能引發隱私問題,但他們強調其目標是獲得對移動模式的更廣泛理解,而不是聚焦於個人行程。他們還指出,通話詳情記錄(CDR)數據作為此類研究的基礎有其局限性。其空間分辨率通常較低,且因用戶相對於手機信號塔位置的變化而容易受到「定位噪音」的影響。然而,他們認為這種不準確性實際上是一種隱私保護措施:
**「我們研究的目標應用是行程檢測和OD估計$$ \* $$,這些是在總體層面進行,而不是個體層面。開發的模型可以直接部署在電信運營商的數據庫伺服器上,無需數據傳輸。此外,與其他形式的大數據(如社交媒體或信用卡交易數據)相比,CDR數據在個人隱私方面的侵入性相對較低。此外,其定位誤差有助於掩蓋用戶的確切位置,提供了另一層隱私保護。」**
經過時間間隔(ETIs)
當我們攜帶手機(不一定是智能手機)移動時,CDR數據作為精確定位工具的局限性顯而易見。經過時間間隔(ETIs),即旅途中我們未撥打或接收電話的時間段,是追蹤我們移動的關鍵標記。這些「沉默」間隔可能使我們暫時從數據網格中消失。
研究人員強調這些間隔如何干擾試圖理解A>B行程的分析系統。數據的稀疏性可能隱藏了「未觀察到的行程」。他們的新方法通過分析ETIs的時空背景並考慮「用戶的個人特徵」來解決這個問題。
數據集
為了構建核心訓練集,研究人員使用了來自中國一個600萬人口城市的主要移動服務運營商的數據。該數據集包括2013年11月300萬用戶的超過20億手機交易,僅聚焦於語音通話和數據訪問記錄。值得注意的是,他們未包含短信數據,這增加了處理稀疏數據的挑戰。
數據包括加密的唯一ID、位置區域碼(LAC)、時間戳、與LAC相關的手機信號塔ID(用於識別涉及交易的具體信號塔),以及表示是撥出/接收通話還是數據使用的活動ID。
*識別隱藏訪問的流程樹。*
這些資訊與信號塔運營數據庫交叉參考,使研究人員能夠確定與每個通信事件相關的信號塔的經度和緯度座標。他們在數據集中識別了9000個信號塔。
研究人員指出,僅基於通話記錄準確猜測行程目的地的難度,因為這些記錄在早晨和下午達到高峰,這與典型的旅行模式一致。由於電話通話可能在行程之前發生,甚至可能觸發行程,這可能會影響目的地估計的準確性。
*一天中手機使用模式的變化。*
用戶主動的數據使用(如消息應用程序)也面臨類似挑戰。然而,像是API系統性輪詢新消息或其他數據(包括應用程序中的GPS和遙測數據)的「自動化」數據使用,有助於識別這些隱藏移動。
處理
研究人員使用了多種機器學習分類器來解決這個問題,包括邏輯回歸、支持向量機(SVM)、隨機森林和梯度提升集成方法。這些分類器使用Python的scikit-learn以默認設置實現。
在這些方法中,邏輯回歸提供了最具可解釋性的模型參數。團隊還發現,較長的ETIs增加了發生隱藏訪問的可能性,尤其在早晨更為顯著。相反,當用戶的CDR數據清楚顯示出大量目的地或中途點時,隱藏訪問的可能性較低。這一發現支持了他們研究的核心原則——最活躍的用戶提供了詳細的移動圖景,從中可以推斷出較不活躍用戶的行為。
在結論中,研究人員建議他們的方法可以應用於其他類型的交通數據,如智能卡數據和地理定位的社交媒體資訊。
這項研究得到了中國能源基金會和中國可持續交通中心的資助。
*\* 起點-目的地*
據報導,員工瀏覽了露骨內容,Meta 因此面臨關於 AI 眼鏡隱私問題的訴訟
Meta 正因旗下 AI 智慧眼鏡的隱私問題面臨新一波訴訟。根據瑞典報紙的調查,一家總部位於肯亞的分包商員工一直在審查客戶的影像資料。據報導,這些影像包含裸露、性行為以及如廁等敏感內容。Meta聲稱會對影像中的臉部進行模糊處理,但新聞報導援引消息來源指出,此舉並非總是能有效發揮作用。這項調查結果促使英國資訊專員辦公室展開調查。這家科技巨頭如今在美國也面臨法律訴訟。在這份新提交的訴狀中,由公益律師事
以優化為驅動的人工智慧,正成為通用的模型發展新途徑
伊利諾大學厄巴納-香檳分校與維吉尼亞大學的研究人員開發出一種新型模型架構,有望為具備更強推理能力且更具韌性的AI系統鋪平道路。名為「能量基變壓器」(EBT)的架構,能自然運用推論時間擴展性來解決複雜挑戰。對企業而言,這意味著能以成本效益方式部署人工智慧應用,無需專門調校模型即可適應新情境。系統二思維的挑戰在心理學中,人類認知通常分為兩種模式:快速直覺的系統一,以及較緩慢、更刻意且具分析性的系統二。
人工智慧熱潮引發網路泡沫時期的泡沫憂慮
數十億美元湧入人工智慧領域的投資熱潮,引發一場激烈辯論:該產業是否正走向網路泡沫式的泡沫?投資者正密切關注熱潮是否降溫,或巨額晶片與基礎建設支出未能帶來預期回報的跡象。美銀全球研究近期調查凸顯此種謹慎態度:54%基金經理人認為人工智慧股票已處泡沫期,38%持反對意見。與網路泡沫的相似之處儘管樂觀情緒蔓延,質疑者仍質疑人工智慧的實質影響力,部分人士更直指其為虛張聲勢或即將破裂的泡沫。思科亞太、日本及
Die Studie zeigt echt spannend, wie sich Bewegungsmuster aus Mobilfunkdaten extrahieren lassen. Gleichzeitig wirft das aber auch Datenschutzfragen auf – wer kontrolliert eigentlich, wie diese Infos genutzt werden? 🧐
Wait, so they're using ML to track our 'hidden visits' now? 😅 Always feels a bit creepy when tech peeks into those unregistered trips... but the data insights could be huge for urban planning or disease tracking, right? Still, makes me side-eye my phone a little more today 🧐
This study on tracking movements with phone data is wild! 😲 It’s like our phones are secretly spilling where we’ve been. Kinda creepy, but super cool how machine learning digs into those 'hidden visits.' Makes me wonder what else they can find out!
This article blew my mind! Using phone data and ML to track hidden visits is so cool, but kinda creepy too. 🤯 Wonder how they balance privacy with all this tech wizardry.





首頁






