“退化”合成面可能会增强面部识别技术
密歇根州立大学的研究人员提出了一种创新方法,利用合成面孔为一个崇高目标服务——提高图像识别系统的准确性。这些合成面孔并非用于制造深伪现象,而是设计为模仿现实世界视频监控录像中常见的不完美特征。
该团队开发了一种可控面孔合成模块(CFSM),能够以反映CCTV系统典型缺陷的风格重新生成面孔,例如面部模糊、低分辨率和传感器噪声。这种方法与使用流行数据集中的高质量名人图像不同,后者无法捕捉面部识别系统在现实世界中面临的挑战。
*可控面孔合成模块(CFSM)的概念架构。* 来源:http://cvlab.cse.msu.edu/pdfs/Liu_Kim_Jain_Liu_ECCV2022.pdf
与专注于复制头部姿势和表情的深伪系统不同,CFSM旨在通过风格迁移生成与目标识别系统风格匹配的替代视图。这一模块对于适应因成本限制而难以升级的旧系统尤其有用,但这些系统仍需为现代面部识别技术做出贡献。
在测试CFSM时,研究人员观察到处理低质量数据的图像识别系统取得了显著改进。他们还发现了一个意外的好处:能够表征和比较目标数据集,简化了为各种CCTV系统进行基准测试和创建定制数据集的过程。
*训练面部识别模型以适应目标系统的局限性。* 来源:http://cvlab.cse.msu.edu/pdfs/Liu_Kim_Jain_Liu_ECCV2022_supp.pdf
该方法还可应用于现有数据集,有效执行领域适应,使其更适合面部识别。这项研究,标题为**可控与引导面孔合成用于无约束面部识别**,部分由美国国家情报总监办公室(ODNI, at IARPA)支持,涉及密歇根州立大学计算机科学与工程系的四名研究人员。
低质量面部识别:一个日益增长的领域
在过去几年中,低质量面部识别(LQFR)已成为一个重要的研究领域。许多为耐用和长期使用而构建的旧视频监控系统已过时,由于技术债务,难以作为机器学习有效的数据源。
从历史到较新的视频监控系统中面部分辨率的变化。来源:https://arxiv.org/pdf/1805.11519.pdf
幸运的是,扩散模型和其他基于噪声的模型非常适合解决这一问题。许多最新的图像合成系统包括将低分辨率图像上采样作为其流程的一部分,这对神经压缩技术也至关重要。
面部识别的挑战在于以最少的特征从低分辨率图像中最大化准确性。这不仅对识别低分辨率面部有用,而且由于训练模型潜在空间中图像大小的限制,也是必要的。
在计算机视觉中,“特征”指的是任何图像的区分特征,不仅仅是面部。随着上采样算法的进步,提出了多种方法来增强低分辨率监控录像,使其可能用于犯罪现场调查等法律用途。
然而,存在误识别的风险,理想情况下,面部识别系统不应需要高分辨率图像来进行准确识别。这种转换成本高昂,且引发了有关其有效性和合法性的问题。
需要更多“落魄”名人
如果面部识别系统能够直接从旧系统输出中提取特征,而无需转换图像,将更有益。这需要更好地理解高分辨率身份与现有监控系统中降质图像之间的关系。
问题在于标准:MS-Celeb-1M和WebFace260M等数据集因提供一致的基准而广泛使用。然而,作者认为,在这些数据集上训练的面部识别算法不适合旧监控系统的视觉领域。
*来自Microsoft的热门MS-Celeb1m数据集的示例。* 来源:https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/
文章指出,由于领域转换问题,最先进的面部识别模型在处理现实世界的监控图像时表现不佳。这些模型在半约束数据集上训练,缺乏现实场景中的变化,如传感器噪声和运动模糊。
之前的方法尝试匹配历史或低成本监控系统的输出,但这些是“盲目”增强。相比之下,CFSM在训练期间使用目标系统的直接反馈,并通过风格迁移进行适应,以模仿该领域。
*女演员Natalie Portman,在计算机视觉社区中占主导地位的少数数据集中并不陌生,在此CFSM示例中,根据实际目标模型领域的反馈执行风格匹配的领域适应。*
作者的架构使用快速梯度符号方法(FGSM)从目标系统的输出中导入风格和特征。随着训练的进行,图像生成部分的流水线对目标系统更加忠实,提高了面部识别性能和泛化能力。
测试与结果
研究人员使用密歇根州立大学的先前工作作为模板,测试了CFSM,采用了MS-Celeb-1m和MS1M-V2作为训练数据集。目标数据是香港中文大学的WiderFace数据集,专为挑战性场景下的面部检测设计。
系统针对四个面部识别基准进行了评估:IJB-B、IJB-C、IJB-S和TinyFace。CFSM使用约10%的MS-Celeb-1m数据(约40万张图像),以批量大小32,使用Adam优化器,学习率为1e-4,进行了125,000次迭代训练。
目标面部识别模型使用了修改后的ResNet-50,结合ArcFace损失函数。还训练了一个附加模型与CFSM进行比较,在结果中标记为“ArcFace”。
*CFSM主要测试的结果。数值越高越好。*
结果显示,结合CFSM的ArcFace模型在面部识别和验证任务中超越了所有基线,达到了新的最先进性能。
从旧监控系统的各种特征中提取领域的能力还允许比较和评估这些系统的分布相似性,以视觉风格的形式呈现,可在未来工作中加以利用。
*来自不同数据集的示例显示出明显的风格差异。*
作者还指出,CFSM展示了如何利用对抗性操纵来提高视觉任务中的识别准确性。他们引入了一种基于学习风格基础的数据集相似性度量,以标签或预测无关的方式捕捉风格差异。
这项研究强调了可控与引导面孔合成模型在无约束面部识别中的潜力,并提供了对数据集差异的洞察。
相关文章
谷歌云为科学研究和发现的突破提供动力
数字革命正在通过前所未有的计算能力改变科学方法。现在,尖端技术增强了理论框架和实验室实验,通过复杂的模拟和大数据分析推动了各学科的突破。通过对基础研究、可扩展云架构和人工智能开发的战略性投资,我们建立了一个加速科学进步的生态系统。我们在制药研究、气候建模和纳米技术等领域做出了突破性创新,并辅之以世界一流的计算基础设施、云原生软件解决方案和新一代生成式人工智能平台。谷歌 DeepMind 的研究实力
人工智能加速科学研究,产生更大的现实影响
谷歌一直将人工智能作为科学进步的催化剂,如今的发现速度已经达到了非凡的新水平。这种加速改变了研究周期,以前所未有的速度将基础性突破转化为实际应用。人工智能不仅不会取代人类的创造力,反而会成为人类潜能的强大放大器。我们的研究人员利用人工智能解决基础科学问题,拓展我们的集体知识,同时为全球挑战开发创新解决方案。通过与学术机构和行业合作伙伴的密切合作,我们致力于通过与更广泛的研究社区共享工具和资源,使这
人工智能中的伦理:应对自动化中的偏见和合规挑战
随着自动化深入各行各业,伦理方面的考虑正成为至关重要的优先事项。决策算法现在影响着社会的重要方面,包括就业机会、金融服务、医疗保健和法律程序,这就需要严格的伦理框架。如果没有适当的管理,这些强大的系统就有可能扩大现有的不平等并造成广泛的伤害。了解人工智能系统中的偏见算法偏见的根源往往在于有缺陷的训练数据。历史上的歧视模式可能会在机器学习模型中永久化--例如,招聘工具会根据过去决定中反映出的受保护特
评论 (12)
0/200
MateoAdams
2025-09-17 04:30:39
실제 얼굴의 불완전함을 모방한 합성 이미지라니... 정말 흥미로운 접근이네요! 🤯 근데 이 기술이 악용되지 않을까 조금 걱정되기도 해요. 얼굴인식 시스템의 정확도를 높이는 건 좋지만, 동시에 보안 문제도 신경써야 할 것 같아요.
0
TimothyEvans
2025-08-23 21:01:18
This is wild! Synthetic faces to boost facial recognition? I’m all for better tech, but I hope they keep an eye on privacy issues. 😎
0
LarryWilliams
2025-04-27 15:58:26
C'est une initiative fascinante pour améliorer la reconnaissance faciale. Utiliser des visages synthétiques plutôt que de contribuer aux deepfakes est une bonne chose. J'espère qu'ils y arriveront bien. 😊🧐
0
CharlesJohnson
2025-04-27 15:57:41
¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌
0
MatthewGonzalez
2025-04-27 04:27:32
Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍
0
FrankSmith
2025-04-27 00:19:01
미시간 주립대 연구진이 하는 이 작업은 정말 멋져 보입니다. 인공 얼굴을 이용해 이미지 인식 기술을 개선하려는 목적 자체가 놀랍네요. 실용성 검증이 필요할 것 같아요. 😎💡
0
密歇根州立大学的研究人员提出了一种创新方法,利用合成面孔为一个崇高目标服务——提高图像识别系统的准确性。这些合成面孔并非用于制造深伪现象,而是设计为模仿现实世界视频监控录像中常见的不完美特征。
该团队开发了一种可控面孔合成模块(CFSM),能够以反映CCTV系统典型缺陷的风格重新生成面孔,例如面部模糊、低分辨率和传感器噪声。这种方法与使用流行数据集中的高质量名人图像不同,后者无法捕捉面部识别系统在现实世界中面临的挑战。
*可控面孔合成模块(CFSM)的概念架构。* 来源:http://cvlab.cse.msu.edu/pdfs/Liu_Kim_Jain_Liu_ECCV2022.pdf
与专注于复制头部姿势和表情的深伪系统不同,CFSM旨在通过风格迁移生成与目标识别系统风格匹配的替代视图。这一模块对于适应因成本限制而难以升级的旧系统尤其有用,但这些系统仍需为现代面部识别技术做出贡献。
在测试CFSM时,研究人员观察到处理低质量数据的图像识别系统取得了显著改进。他们还发现了一个意外的好处:能够表征和比较目标数据集,简化了为各种CCTV系统进行基准测试和创建定制数据集的过程。
*训练面部识别模型以适应目标系统的局限性。* 来源:http://cvlab.cse.msu.edu/pdfs/Liu_Kim_Jain_Liu_ECCV2022_supp.pdf
该方法还可应用于现有数据集,有效执行领域适应,使其更适合面部识别。这项研究,标题为**可控与引导面孔合成用于无约束面部识别**,部分由美国国家情报总监办公室(ODNI, at IARPA)支持,涉及密歇根州立大学计算机科学与工程系的四名研究人员。
低质量面部识别:一个日益增长的领域
在过去几年中,低质量面部识别(LQFR)已成为一个重要的研究领域。许多为耐用和长期使用而构建的旧视频监控系统已过时,由于技术债务,难以作为机器学习有效的数据源。
从历史到较新的视频监控系统中面部分辨率的变化。来源:https://arxiv.org/pdf/1805.11519.pdf
幸运的是,扩散模型和其他基于噪声的模型非常适合解决这一问题。许多最新的图像合成系统包括将低分辨率图像上采样作为其流程的一部分,这对神经压缩技术也至关重要。
面部识别的挑战在于以最少的特征从低分辨率图像中最大化准确性。这不仅对识别低分辨率面部有用,而且由于训练模型潜在空间中图像大小的限制,也是必要的。
在计算机视觉中,“特征”指的是任何图像的区分特征,不仅仅是面部。随着上采样算法的进步,提出了多种方法来增强低分辨率监控录像,使其可能用于犯罪现场调查等法律用途。
然而,存在误识别的风险,理想情况下,面部识别系统不应需要高分辨率图像来进行准确识别。这种转换成本高昂,且引发了有关其有效性和合法性的问题。
需要更多“落魄”名人
如果面部识别系统能够直接从旧系统输出中提取特征,而无需转换图像,将更有益。这需要更好地理解高分辨率身份与现有监控系统中降质图像之间的关系。
问题在于标准:MS-Celeb-1M和WebFace260M等数据集因提供一致的基准而广泛使用。然而,作者认为,在这些数据集上训练的面部识别算法不适合旧监控系统的视觉领域。
*来自Microsoft的热门MS-Celeb1m数据集的示例。* 来源:https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/
文章指出,由于领域转换问题,最先进的面部识别模型在处理现实世界的监控图像时表现不佳。这些模型在半约束数据集上训练,缺乏现实场景中的变化,如传感器噪声和运动模糊。
之前的方法尝试匹配历史或低成本监控系统的输出,但这些是“盲目”增强。相比之下,CFSM在训练期间使用目标系统的直接反馈,并通过风格迁移进行适应,以模仿该领域。
*女演员Natalie Portman,在计算机视觉社区中占主导地位的少数数据集中并不陌生,在此CFSM示例中,根据实际目标模型领域的反馈执行风格匹配的领域适应。*
作者的架构使用快速梯度符号方法(FGSM)从目标系统的输出中导入风格和特征。随着训练的进行,图像生成部分的流水线对目标系统更加忠实,提高了面部识别性能和泛化能力。
测试与结果
研究人员使用密歇根州立大学的先前工作作为模板,测试了CFSM,采用了MS-Celeb-1m和MS1M-V2作为训练数据集。目标数据是香港中文大学的WiderFace数据集,专为挑战性场景下的面部检测设计。
系统针对四个面部识别基准进行了评估:IJB-B、IJB-C、IJB-S和TinyFace。CFSM使用约10%的MS-Celeb-1m数据(约40万张图像),以批量大小32,使用Adam优化器,学习率为1e-4,进行了125,000次迭代训练。
目标面部识别模型使用了修改后的ResNet-50,结合ArcFace损失函数。还训练了一个附加模型与CFSM进行比较,在结果中标记为“ArcFace”。
*CFSM主要测试的结果。数值越高越好。*
结果显示,结合CFSM的ArcFace模型在面部识别和验证任务中超越了所有基线,达到了新的最先进性能。
从旧监控系统的各种特征中提取领域的能力还允许比较和评估这些系统的分布相似性,以视觉风格的形式呈现,可在未来工作中加以利用。
*来自不同数据集的示例显示出明显的风格差异。*
作者还指出,CFSM展示了如何利用对抗性操纵来提高视觉任务中的识别准确性。他们引入了一种基于学习风格基础的数据集相似性度量,以标签或预测无关的方式捕捉风格差异。
这项研究强调了可控与引导面孔合成模型在无约束面部识别中的潜力,并提供了对数据集差异的洞察。



실제 얼굴의 불완전함을 모방한 합성 이미지라니... 정말 흥미로운 접근이네요! 🤯 근데 이 기술이 악용되지 않을까 조금 걱정되기도 해요. 얼굴인식 시스템의 정확도를 높이는 건 좋지만, 동시에 보안 문제도 신경써야 할 것 같아요.




This is wild! Synthetic faces to boost facial recognition? I’m all for better tech, but I hope they keep an eye on privacy issues. 😎




C'est une initiative fascinante pour améliorer la reconnaissance faciale. Utiliser des visages synthétiques plutôt que de contribuer aux deepfakes est une bonne chose. J'espère qu'ils y arriveront bien. 😊🧐




¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌




Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍




미시간 주립대 연구진이 하는 이 작업은 정말 멋져 보입니다. 인공 얼굴을 이용해 이미지 인식 기술을 개선하려는 목적 자체가 놀랍네요. 실용성 검증이 필요할 것 같아요. 😎💡












