AI工具透過移除數位妝容來繞過過濾器
面部化妝品正讓未成年使用者(主要是女孩)得以繞過交友應用程式和電商網站等平台的自拍式年齡驗證系統。一款新型人工智慧工具透過訓練有別的模型來解決此漏洞,該模型能去除妝容同時保留面部特徵,使未成年人更難欺騙自動化檢查。
隨著全球線上年齡驗證趨勢發展,採用第三方自拍年齡驗證服務的案例正持續增加。
例如根據英國《網路安全法》,第三方服務可透過視覺年齡估算等技術執行驗證——人工智慧能從手機即時影像預測使用者年齡。Ondato、TrustStamp與Yoti等供應商皆採用此技術。
然而年齡估算並非萬無一失。青少年長期為獲取成人特權所做的努力,促使他們發展出有效進入交友網站、論壇及其他年齡限制平台的方法。
其中常見手法(尤以女性*為甚)是透過化妝修飾面容——此策略能有效欺騙自動化年齡估算系統,因該系統常高估年輕族群年齡,卻低估年長者年齡。
不僅限於女孩
在回應「化妝品聚焦女性」的潛在質疑前,必須強調:無論施作對象為何,面部彩妝皆非可靠的性別判斷指標:

美國研究者在《面部化妝品對自動性別與年齡估算演算法的影響》中發現,性別驗證系統會因性別轉換妝容而產生混淆。來源:https://cse.msu.edu/~rossarun/pubs/ChenCosmeticsGenderAge_VISAPP2014.pdf
2024年數據顯示,美國18至24歲男性消費者中,約72%將化妝納入日常儀容流程——儘管多數人使用化妝品是為了呈現健康膚質,而非採用睫毛膏/唇膏等典型女性美學組合。
因此,我們必須基於近期研究中最常見的情境來探討此議題:未成年女性使用化妝品來規避自動化視覺年齡驗證系統。
高效卸妝技術——人工智慧之道
此項研究由紐約大學三位學者共同發表於新論文《DiffClean:基於擴散的精準年齡估算化妝品去除技術》。
該專案旨在開發人工智慧驅動的技術,從圖像(及潛在的影片)中消除妝容外觀,以更精準判斷人物真實年齡。

新論文展示的範例,呈現卸除妝容如何顯著改變年齡預測結果。來源:https://arxiv.org/pdf/2507.13292
開發此類系統面臨的挑戰之一,在於收集或整理未成年少女塗抹成人化妝品的影像存在敏感性問題。為解決此困境,研究團隊採用第三方生成對抗網路系統EleGANt進行合成化妝風格——此方法成效卓著:

清華大學2022年研發的EleGANt系統運用生成對抗網路(GAN),能真實地將化妝效果疊加至原始照片。來源:https://arxiv.org/pdf/2207.09840
透過此方式生成的合成數據,結合多項輔助專案與數據集,作者在處理明顯或「表演性」妝容時,其成果超越了當今最先進的年齡估算方法。
論文指出:
「DiffClean運用文本引導擴散模型消除化妝痕跡,以抵禦化妝攻擊。相較於競爭基準模型,其在數位模擬與真實化妝影像上,提升年齡估算(未成年與成年準確率提升4.8%)及面部驗證(在FMR=0.01%時,TMR準確率提升8.9%)的表現。」
讓我們檢視其方法論。
方法
為避免使用未成年人化妝的真實影像,作者運用EleGANt技術對UTKFace資料庫影像施加合成化妝效果,生成訓練用的前後對比影像組。

UTKFace資料集範例。來源:https://susanqq.github.io/UTKFace/
隨後訓練DiffClean逆向還原此變換。鑑於年齡估算演算法對年輕族群最為困難,研究人員開發出專為10-19歲年齡層微調的代理年齡分類器。他們採用基於UTKFace訓練的SSRNet架構,並搭配加權L1損失函數。
模型核心採用簡化版的 OpenAI 2021 年擴散模型,並在多解析度層級增設注意力頭、深化層級結構,並導入 BigGAN 風格模組以強化上採樣與下採樣效能。
透過CLIP提示實現方向性控制:化妝與素顏的臉部對照,引導模型在保留面部細節、年齡特徵及身份辨識的前提下卸除妝容。

合成妝容透過EleGANt技術施作。每組三聯圖分別呈現原始UTKFace圖像(左)、參考妝容風格(中)及風格轉移後成果(右)。此類妝容轉移技術在電腦視覺研究中普遍應用,亦見於Adobe Photoshop的神經濾鏡功能,可將參考圖像的妝容套用至目標圖像。
四項關鍵損失函數引導卸妝過程,同時維持面部身份與年齡特徵。除基於CLIP的損失函數外,身份保留採用InsightFace庫的加權ArcFace損失函數,透過測量生成面部與原始素顏圖及「上妝」版本的相似度確保一致性。
第三項感知損失採用學習感知相似度指標(LPIPS),運用L1距離確保像素層級的真實感,在卸除妝容後維持原始影像外觀。
最後,年齡監督模組採用經UTKFace數據集訓練的微調版SSRNet,其平滑L1損失函數針對10-29歲年齡段(誤判最常見區間)實施更嚴格的懲罰機制。變體方案則運用基於CLIP的年齡提示,實現特定年齡的外觀匹配。
推論階段的年齡估算則採用2023年推出的MiVOLO框架。
數據與測試
UTKFace數據集的SSRNet微調訓練採用15,364張訓練圖像與6,701張測試圖像。原始20,000張圖像經篩選排除70歲以上個體後,按70:30比例分割。
遵循2023年DiffAM專案方法,訓練分為兩階段:初始階段採用BeautyGAN MT資料集中的300張真實妝容圖像(200張訓練,100張驗證)。
後續運用300張經EleGANt合成彩妝的UTKFace圖像進行模型精煉,最終形成包含600組訓練樣本的數據集,這些樣本對應BeautyGAN的五種參考風格。鑑於卸妝過程需將多種風格映射至單一素顏面部,訓練重點在於實現廣泛泛化能力,而非涵蓋所有化妝變體。
性能評估涵蓋合成與真實圖像:合成測試採用Flickr-Faces-HQ Dataset(FFHQ)中2,556張圖像,均勻採樣自70歲以下九個年齡層,並經EleGANt修改;
泛化能力則透過BeautyFace的3,000張實妝圖像及LADN的355張實妝圖像進行評估。

BeautyFace資料集範例,展示定義化妝影響不同臉部區域的語義分割。來源:https://li-chongyi.github.io/BeautyREC_files/
指標與實作
指標方面,作者採用真實年齡與預測值間的平均絕對誤差(MAE,數值越低越好);年齡分組準確度以評估分類正確性(數值越低越好);以及未成年/成年準確度以評估成人識別正確性(數值越高越好)。
研究同時報告身分驗證指標:真實匹配率(TMR)與虛假匹配率(FMR),並附相關接收者操作特性曲線(ROC)數值。
SSRNet於64×64像素圖像上進行微調,批次大小為50,採用Adam優化器、權重衰減1e−4、餘弦退火調度器,並以1e−3學習率執行200個 epoch,同時啟用早期終止機制。
DiffClean接受256×256像素輸入圖像,採用Adam優化器以4e−3學習率進行五個 epoch 的微調。採樣過程包含40次DDIM逆向步驟與6次DDIM順向步驟。所有訓練均在單張NVIDIA A100 GPU上完成。
測試的競爭系統為 CLIP2Protect 與 DiffAM。作者採用「霧面」妝容風格,其中 CLIP2Protect 表現更為優異。
為建立 DiffAM 基準線,將 BeautyGAN 預訓練模型在 MT 資料集上進行微調。針對敵對性化妝轉移任務,則直接採用 DiffAM 檢查點並維持預設參數。

DiffClean相較於基準模型在MiVOLO年齡估算任務中的表現。報告指標包含未成年/成年分類準確度、年齡分組準確度及平均絕對誤差(MAE)。採用CLIP年齡損失的DiffClean在所有指標中均取得最佳結果。
作者聲明:
「[我們的]方法DIFFCLEAN超越了兩個基準模型CLIP2Protect和DiffAM,成功恢復因化妝干擾的年齡線索,將MAE降低至5.71,並將整體年齡組預測準確度提升至37%。
本研究聚焦未成年年齡層,結果顯示我們在未成年與成年年齡分類中達到88.6%的卓越準確度。」

基準方法與提案方法的卸妝結果對照。最左列為原始影像,次列為CLIP2Protect與DiffAM輸出結果,第三列則展示DiffClean透過SSRNet與CLIP年齡損失模型處理後的成果。作者主張DiffClean能更有效去除妝容,既避免CLIP2Protect出現的特徵失真,亦能補足DiffAM遺漏的殘留化妝痕跡。
作者指出化妝對感知年齡的影響並非均勻——可能增加、減少或維持不變。因此DiffClean並非統一降低預測年齡,而是透過去除化妝痕跡來恢復原始年齡指標:

CelebA-HQ與CACD資料集的卸妝範例。每列展示卸妝前後(左/右)的對比圖像。首列顯示卸妝後預測年齡下降;次列維持不變;第三列則呈現上升趨勢。
為驗證泛化能力,我們將 DiffClean 應用於 BeautyFace 與 LADN 資料集(含真實妝容但無對應無妝照)。透過比較卸妝前後的年齡預測值,衡量 DiffClean 消除妝容干擾的成效:

LADN(左對)與BeautyFace(右對)真實圖像的卸妝結果。DiffClean透過去除化妝品降低預測年齡,縮小表觀年齡與實際年齡的差距。白色數字顯示處理前後的估算年齡。
結果顯示DiffClean能持續縮小外觀年齡與實際年齡的差距,平均減少約三年的高估與低估誤差,顯示其對真實世界化妝風格具有強大的泛化能力。
結論
顯著妝容被用於敵對任務既耐人尋味,或許也是必然趨勢。由於女孩成熟速度各異但整體趨快,識別從未成年女性到成年女性的轉變階段,是本研究領域最具挑戰性的目標之一。
然而隨著時間推移,數據或將揭示一致的年齡相關指標,為視覺年齡驗證系統提供基準。
* 鑑於本議題敏感性,且「女孩」一詞具排他性(而現行通用術語「女性與女孩」在此情境不適用),故採用「女性」作為最佳折衷方案——雖未能涵蓋所有人口統計細微差異,謹此致歉。
†本文中「表演性」指明確為展示與辨識而施作的妝容,如睫毛膏、眼線、腮紅與粉底,有別於遮瑕膏等低調化妝手法。
初版發佈於2025年7月18日(星期五)
相關文章
ChatGPT 成人模式再度延遲;Ultraman:智慧優先
OpenAI 再次推遲爭議性功能,聚焦於個人化與主動互動「不當內容」是否應納入高效能的 AI 工具,長期以來在科技界引發熱議。 OpenAI 曾承諾要讓 ChatGPT 更理解成人用戶,但再次讓期待這項變革的人們感到失望。根據 IT Home 的報導,該公司最近證實,原本預計於 2026 年第一季推出的所謂「成人模式」,已再度延期。這並非 Sam Altman 首次食言。早在 2025 年底,他就
百度健康內部測試 AI 醫生助理「DoctorClaw」,短期內將用於學術資料檢索與辦公室輔助
據報導,百度健康已開始對一款專為醫師設計的專業 AI 智慧助理進行內部測試。這款內部代號為「DoctorClaw」(龍蝦醫生版)的產品,標誌著百度在醫療領域部署大型語言模型方面邁出了重要一步。知情人士透露,該專案目前仍處於封閉開發階段,現已進入內部測試。雖然具體產品形式尚未完全公開,但已接近推出。 就功能而言,DoctorClaw 初期將聚焦於學術文獻檢索與常規診間輔助。然而,其長期戰略旨在深度融
《Cursor Composer 2》對決《Claude Opus 4.6》:效能測試引發新一輪 AI 程式設計辯論
3月19日,Cursor 正式發布其自主研發的編碼模型 Composer 2。 這項公告在開發者社群中立即引發熱議——根據 Cursor 的說法,Composer 2 在 Terminal-Bench 2.0 上的得分為 61.7%,在相同的測試條件下,顯著超越了 Claude Opus 4.6 的 58.0%。Anthropic 的旗艦模型,竟被自家 IDE 內建的模型超越?隨著消息傳開,相關辯
相關專題推薦
評論 (0)
0/500
面部化妝品正讓未成年使用者(主要是女孩)得以繞過交友應用程式和電商網站等平台的自拍式年齡驗證系統。一款新型人工智慧工具透過訓練有別的模型來解決此漏洞,該模型能去除妝容同時保留面部特徵,使未成年人更難欺騙自動化檢查。
隨著全球線上年齡驗證趨勢發展,採用第三方自拍年齡驗證服務的案例正持續增加。
例如根據英國《網路安全法》,第三方服務可透過視覺年齡估算等技術執行驗證——人工智慧能從手機即時影像預測使用者年齡。Ondato、TrustStamp與Yoti等供應商皆採用此技術。
然而年齡估算並非萬無一失。青少年長期為獲取成人特權所做的努力,促使他們發展出有效進入交友網站、論壇及其他年齡限制平台的方法。
其中常見手法(尤以女性*為甚)是透過化妝修飾面容——此策略能有效欺騙自動化年齡估算系統,因該系統常高估年輕族群年齡,卻低估年長者年齡。
不僅限於女孩
在回應「化妝品聚焦女性」的潛在質疑前,必須強調:無論施作對象為何,面部彩妝皆非可靠的性別判斷指標:

美國研究者在《面部化妝品對自動性別與年齡估算演算法的影響》中發現,性別驗證系統會因性別轉換妝容而產生混淆。來源:https://cse.msu.edu/~rossarun/pubs/ChenCosmeticsGenderAge_VISAPP2014.pdf
2024年數據顯示,美國18至24歲男性消費者中,約72%將化妝納入日常儀容流程——儘管多數人使用化妝品是為了呈現健康膚質,而非採用睫毛膏/唇膏等典型女性美學組合。
因此,我們必須基於近期研究中最常見的情境來探討此議題:未成年女性使用化妝品來規避自動化視覺年齡驗證系統。
高效卸妝技術——人工智慧之道
此項研究由紐約大學三位學者共同發表於新論文《DiffClean:基於擴散的精準年齡估算化妝品去除技術》。
該專案旨在開發人工智慧驅動的技術,從圖像(及潛在的影片)中消除妝容外觀,以更精準判斷人物真實年齡。

新論文展示的範例,呈現卸除妝容如何顯著改變年齡預測結果。來源:https://arxiv.org/pdf/2507.13292
開發此類系統面臨的挑戰之一,在於收集或整理未成年少女塗抹成人化妝品的影像存在敏感性問題。為解決此困境,研究團隊採用第三方生成對抗網路系統EleGANt進行合成化妝風格——此方法成效卓著:

清華大學2022年研發的EleGANt系統運用生成對抗網路(GAN),能真實地將化妝效果疊加至原始照片。來源:https://arxiv.org/pdf/2207.09840
透過此方式生成的合成數據,結合多項輔助專案與數據集,作者在處理明顯或「表演性」妝容時,其成果超越了當今最先進的年齡估算方法。
論文指出:
「DiffClean運用文本引導擴散模型消除化妝痕跡,以抵禦化妝攻擊。相較於競爭基準模型,其在數位模擬與真實化妝影像上,提升年齡估算(未成年與成年準確率提升4.8%)及面部驗證(在FMR=0.01%時,TMR準確率提升8.9%)的表現。」
讓我們檢視其方法論。
方法
為避免使用未成年人化妝的真實影像,作者運用EleGANt技術對UTKFace資料庫影像施加合成化妝效果,生成訓練用的前後對比影像組。

UTKFace資料集範例。來源:https://susanqq.github.io/UTKFace/
隨後訓練DiffClean逆向還原此變換。鑑於年齡估算演算法對年輕族群最為困難,研究人員開發出專為10-19歲年齡層微調的代理年齡分類器。他們採用基於UTKFace訓練的SSRNet架構,並搭配加權L1損失函數。
模型核心採用簡化版的 OpenAI 2021 年擴散模型,並在多解析度層級增設注意力頭、深化層級結構,並導入 BigGAN 風格模組以強化上採樣與下採樣效能。
透過CLIP提示實現方向性控制:化妝與素顏的臉部對照,引導模型在保留面部細節、年齡特徵及身份辨識的前提下卸除妝容。

合成妝容透過EleGANt技術施作。每組三聯圖分別呈現原始UTKFace圖像(左)、參考妝容風格(中)及風格轉移後成果(右)。此類妝容轉移技術在電腦視覺研究中普遍應用,亦見於Adobe Photoshop的神經濾鏡功能,可將參考圖像的妝容套用至目標圖像。
四項關鍵損失函數引導卸妝過程,同時維持面部身份與年齡特徵。除基於CLIP的損失函數外,身份保留採用InsightFace庫的加權ArcFace損失函數,透過測量生成面部與原始素顏圖及「上妝」版本的相似度確保一致性。
第三項感知損失採用學習感知相似度指標(LPIPS),運用L1距離確保像素層級的真實感,在卸除妝容後維持原始影像外觀。
最後,年齡監督模組採用經UTKFace數據集訓練的微調版SSRNet,其平滑L1損失函數針對10-29歲年齡段(誤判最常見區間)實施更嚴格的懲罰機制。變體方案則運用基於CLIP的年齡提示,實現特定年齡的外觀匹配。
推論階段的年齡估算則採用2023年推出的MiVOLO框架。
數據與測試
UTKFace數據集的SSRNet微調訓練採用15,364張訓練圖像與6,701張測試圖像。原始20,000張圖像經篩選排除70歲以上個體後,按70:30比例分割。
遵循2023年DiffAM專案方法,訓練分為兩階段:初始階段採用BeautyGAN MT資料集中的300張真實妝容圖像(200張訓練,100張驗證)。
後續運用300張經EleGANt合成彩妝的UTKFace圖像進行模型精煉,最終形成包含600組訓練樣本的數據集,這些樣本對應BeautyGAN的五種參考風格。鑑於卸妝過程需將多種風格映射至單一素顏面部,訓練重點在於實現廣泛泛化能力,而非涵蓋所有化妝變體。
性能評估涵蓋合成與真實圖像:合成測試採用Flickr-Faces-HQ Dataset(FFHQ)中2,556張圖像,均勻採樣自70歲以下九個年齡層,並經EleGANt修改;
泛化能力則透過BeautyFace的3,000張實妝圖像及LADN的355張實妝圖像進行評估。

BeautyFace資料集範例,展示定義化妝影響不同臉部區域的語義分割。來源:https://li-chongyi.github.io/BeautyREC_files/
指標與實作
指標方面,作者採用真實年齡與預測值間的平均絕對誤差(MAE,數值越低越好);年齡分組準確度以評估分類正確性(數值越低越好);以及未成年/成年準確度以評估成人識別正確性(數值越高越好)。
研究同時報告身分驗證指標:真實匹配率(TMR)與虛假匹配率(FMR),並附相關接收者操作特性曲線(ROC)數值。
SSRNet於64×64像素圖像上進行微調,批次大小為50,採用Adam優化器、權重衰減1e−4、餘弦退火調度器,並以1e−3學習率執行200個 epoch,同時啟用早期終止機制。
DiffClean接受256×256像素輸入圖像,採用Adam優化器以4e−3學習率進行五個 epoch 的微調。採樣過程包含40次DDIM逆向步驟與6次DDIM順向步驟。所有訓練均在單張NVIDIA A100 GPU上完成。
測試的競爭系統為 CLIP2Protect 與 DiffAM。作者採用「霧面」妝容風格,其中 CLIP2Protect 表現更為優異。
為建立 DiffAM 基準線,將 BeautyGAN 預訓練模型在 MT 資料集上進行微調。針對敵對性化妝轉移任務,則直接採用 DiffAM 檢查點並維持預設參數。

DiffClean相較於基準模型在MiVOLO年齡估算任務中的表現。報告指標包含未成年/成年分類準確度、年齡分組準確度及平均絕對誤差(MAE)。採用CLIP年齡損失的DiffClean在所有指標中均取得最佳結果。
作者聲明:
「[我們的]方法DIFFCLEAN超越了兩個基準模型CLIP2Protect和DiffAM,成功恢復因化妝干擾的年齡線索,將MAE降低至5.71,並將整體年齡組預測準確度提升至37%。
本研究聚焦未成年年齡層,結果顯示我們在未成年與成年年齡分類中達到88.6%的卓越準確度。」

基準方法與提案方法的卸妝結果對照。最左列為原始影像,次列為CLIP2Protect與DiffAM輸出結果,第三列則展示DiffClean透過SSRNet與CLIP年齡損失模型處理後的成果。作者主張DiffClean能更有效去除妝容,既避免CLIP2Protect出現的特徵失真,亦能補足DiffAM遺漏的殘留化妝痕跡。
作者指出化妝對感知年齡的影響並非均勻——可能增加、減少或維持不變。因此DiffClean並非統一降低預測年齡,而是透過去除化妝痕跡來恢復原始年齡指標:

CelebA-HQ與CACD資料集的卸妝範例。每列展示卸妝前後(左/右)的對比圖像。首列顯示卸妝後預測年齡下降;次列維持不變;第三列則呈現上升趨勢。
為驗證泛化能力,我們將 DiffClean 應用於 BeautyFace 與 LADN 資料集(含真實妝容但無對應無妝照)。透過比較卸妝前後的年齡預測值,衡量 DiffClean 消除妝容干擾的成效:

LADN(左對)與BeautyFace(右對)真實圖像的卸妝結果。DiffClean透過去除化妝品降低預測年齡,縮小表觀年齡與實際年齡的差距。白色數字顯示處理前後的估算年齡。
結果顯示DiffClean能持續縮小外觀年齡與實際年齡的差距,平均減少約三年的高估與低估誤差,顯示其對真實世界化妝風格具有強大的泛化能力。
結論
顯著妝容被用於敵對任務既耐人尋味,或許也是必然趨勢。由於女孩成熟速度各異但整體趨快,識別從未成年女性到成年女性的轉變階段,是本研究領域最具挑戰性的目標之一。
然而隨著時間推移,數據或將揭示一致的年齡相關指標,為視覺年齡驗證系統提供基準。
* 鑑於本議題敏感性,且「女孩」一詞具排他性(而現行通用術語「女性與女孩」在此情境不適用),故採用「女性」作為最佳折衷方案——雖未能涵蓋所有人口統計細微差異,謹此致歉。
†本文中「表演性」指明確為展示與辨識而施作的妝容,如睫毛膏、眼線、腮紅與粉底,有別於遮瑕膏等低調化妝手法。
初版發佈於2025年7月18日(星期五)
ChatGPT 成人模式再度延遲;Ultraman:智慧優先
OpenAI 再次推遲爭議性功能,聚焦於個人化與主動互動「不當內容」是否應納入高效能的 AI 工具,長期以來在科技界引發熱議。 OpenAI 曾承諾要讓 ChatGPT 更理解成人用戶,但再次讓期待這項變革的人們感到失望。根據 IT Home 的報導,該公司最近證實,原本預計於 2026 年第一季推出的所謂「成人模式」,已再度延期。這並非 Sam Altman 首次食言。早在 2025 年底,他就
百度健康內部測試 AI 醫生助理「DoctorClaw」,短期內將用於學術資料檢索與辦公室輔助
據報導,百度健康已開始對一款專為醫師設計的專業 AI 智慧助理進行內部測試。這款內部代號為「DoctorClaw」(龍蝦醫生版)的產品,標誌著百度在醫療領域部署大型語言模型方面邁出了重要一步。知情人士透露,該專案目前仍處於封閉開發階段,現已進入內部測試。雖然具體產品形式尚未完全公開,但已接近推出。 就功能而言,DoctorClaw 初期將聚焦於學術文獻檢索與常規診間輔助。然而,其長期戰略旨在深度融
《Cursor Composer 2》對決《Claude Opus 4.6》:效能測試引發新一輪 AI 程式設計辯論
3月19日,Cursor 正式發布其自主研發的編碼模型 Composer 2。 這項公告在開發者社群中立即引發熱議——根據 Cursor 的說法,Composer 2 在 Terminal-Bench 2.0 上的得分為 61.7%,在相同的測試條件下,顯著超越了 Claude Opus 4.6 的 58.0%。Anthropic 的旗艦模型,竟被自家 IDE 內建的模型超越?隨著消息傳開,相關辯





首頁






