option
Maison
Nouvelles
Les visages synthétiques «dégradés» peuvent améliorer la technologie de reconnaissance faciale

Les visages synthétiques «dégradés» peuvent améliorer la technologie de reconnaissance faciale

25 avril 2025
77

Des chercheurs de la Michigan State University ont trouvé une façon innovante d'utiliser des visages synthétiques pour une cause noble - améliorant la précision des systèmes de reconnaissance d'image. Au lieu de contribuer au phénomène Deepfakes, ces visages synthétiques sont conçus pour imiter les imperfections trouvées dans des images de vidéosurveillance du monde réel.

L'équipe a développé un module de synthèse de visage contrôlable (CFSM) qui peut régénérer les faces dans un style qui reflète les défauts typiques des systèmes de vidéosurveillance, tels que le flou facial, la basse résolution et le bruit du capteur. Cette approche diffère de l'utilisation d'images de célébrités de haute qualité des ensembles de données populaires, qui ne saisissent pas les défis du monde réel auxquels sont confrontés les systèmes de reconnaissance faciale.

Architecture conceptuelle pour le module de synthèse du visage contrôlable (CFSM). Source: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022.pdf * Architecture conceptuelle pour le module de synthèse face contrôlable (CFSM). * Source: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022.pdf

Contrairement aux systèmes DeepFake qui se concentrent sur la réplication des poses et des expressions de la tête, CFSM vise à générer des vues alternatives qui correspondent au style du système de reconnaissance cible grâce au transfert de style. Ce module est particulièrement utile pour s'adapter aux systèmes hérités qui sont peu susceptibles d'être mis à niveau en raison de contraintes de coûts mais doivent toujours contribuer aux technologies de reconnaissance faciale modernes.

Lors du test de CFSM, les chercheurs ont observé des améliorations significatives des systèmes de reconnaissance d'image traitant de données de faible qualité. Ils ont également découvert un avantage inattendu: la possibilité de caractériser et de comparer les ensembles de données cibles, ce qui simplifie le processus de comparaison et de création de ensembles de données sur mesure pour divers systèmes de vidéosurveillance.

Formation des modèles de reconnaissance faciale à s'adapter aux limites des systèmes cibles. Source: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022_supp.pdf * Formation des modèles de reconnaissance faciale pour s'adapter aux limites des systèmes cibles. * Source: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022_supp.pdf

La méthode peut également être appliquée aux ensembles de données existants, effectuant efficacement l'adaptation du domaine pour les rendre plus adaptés à la reconnaissance faciale. La recherche, intitulée ** Contrôlable et Guided Face Synthesis pour la reconnaissance faciale sans contrainte **, est partiellement soutenue par le Bureau américain du directeur du renseignement national (ODNI, à l'IARPA) et implique quatre chercheurs du département informatique et génie de MSU.

Reconnaissance faciale de basse qualité: un champ croissant

Au cours des dernières années, la reconnaissance faciale de faible qualité (LQFR) est devenue un domaine d'étude important. De nombreux systèmes de surveillance vidéo plus anciens, conçus pour être durables et durables, sont devenus obsolètes et ont du mal à servir de sources de données efficaces pour l'apprentissage automatique en raison de la dette technique.

Des niveaux variables de résolution faciale à travers une gamme de systèmes de surveillance vidéo historiques et plus récents. Source: https://arxiv.org/pdf/1805.11519.pdf Des niveaux variables de résolution faciale à travers une gamme de systèmes de surveillance vidéo historiques et plus récents. Source: https://arxiv.org/pdf/1805.11519.pdf

F Heureusement, les modèles de diffusion et d'autres modèles basés sur le bruit sont bien adaptés pour résoudre ce problème. Bon nombre des derniers systèmes de synthèse d'images incluent une augmentation des images à basse résolution dans le cadre de leur processus, qui est également crucial pour les techniques de compression neuronale.

Le défi de la reconnaissance faciale est de maximiser la précision avec le moins de caractéristiques possibles extraites des images à basse résolution. Ceci est non seulement utile pour identifier les visages à faible résolution, mais également nécessaires en raison de limitations de taille de l'image dans l'espace latent des modèles d'entraînement.

Dans la vision par ordinateur, les «fonctionnalités» se réfèrent aux caractéristiques distinctives de toute image, pas seulement des visages. Avec l'avancement des algorithmes d'amélioration des algorithmes, diverses méthodes ont été proposées pour améliorer les images de surveillance à basse résolution, ce qui le rend potentiellement utilisable à des fins juridiques comme les enquêtes sur les lieux du crime.

Cependant, il existe un risque d'identification, et idéalement, les systèmes de reconnaissance faciale ne devraient pas nécessiter des images haute résolution pour faire des identifications précises. Ces transformations sont coûteuses et soulèvent des questions sur leur validité et leur légalité.

La nécessité de plus de célébrités «en bas à tachet»

Il serait plus bénéfique si les systèmes de reconnaissance faciale pouvaient extraire les caractéristiques directement de la sortie des systèmes hérités sans avoir besoin de transformer les images. Cela nécessite une meilleure compréhension de la relation entre les identités haute résolution et les images dégradées des systèmes de surveillance existants.

Le problème réside dans les normes: des ensembles de données comme MS-Celeb-1m et WebFace260m sont largement utilisés car ils fournissent des repères cohérents. Cependant, les auteurs soutiennent que les algorithmes de reconnaissance faciale formés sur ces ensembles de données ne conviennent pas aux domaines visuels des anciens systèmes de surveillance.

Exemples de l'ensemble de données MS-Celeb1m populaire de Microsoft. Source: https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognising-one-million-celebrities-real-world/ * Exemples de l'ensemble de données MS-CELEB1M populaire de Microsoft. * Source: https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognising-one-million-celebrities-real-world/

L'article souligne que les modèles de reconnaissance faciale de pointe ont du mal avec l'imagerie de surveillance du monde réel en raison de problèmes de décalage de domaine. Ces modèles sont formés sur des ensembles de données semi-limités qui n'ont pas les variations trouvées dans les scénarios du monde réel, tels que le bruit du capteur et le flou de mouvement.

Les méthodes précédentes ont tenté de correspondre aux sorties des systèmes de surveillance historiques ou à faible coût, mais ce sont des augmentations «aveugles». En revanche, CFSM utilise la rétroaction directe du système cible pendant la formation et s'adapte via le transfert de style pour imiter ce domaine.

L'actrice Natalie Portman, pas étrangère à la poignée d'ensembles de données qui dominent la communauté de la vision par ordinateur, figure parmi les identités de cet exemple de l'adaptation de domaine CFSM, approuvant le style, basée sur les commentaires du domaine du modèle cible réel. * L'actrice Natalie Portman, pas étrangère à la poignée d'ensembles de données qui dominent la communauté de la vision par ordinateur, figure parmi les identités de cet exemple de l'adaptation de domaine CFSM, approuvant le style basé sur les commentaires du domaine du modèle cible réel. *

L'architecture des auteurs utilise la méthode de signe du gradient rapide (FGSM) pour importer des styles et des caractéristiques à partir de la sortie du système cible. Au fur et à mesure que la formation progresse, la partie de la génération d'images du pipeline devient plus fidèle au système cible, améliorant les capacités de performance et de généralisation de la reconnaissance faciale.

Tests et résultats

Les chercheurs ont testé CFSM en utilisant le travail antérieur de MSU comme modèle, utilisant MS-Celeb-1M et MS1M-V2 comme ensembles de données de formation. Les données cibles étaient l'ensemble de données Widerface de l'Université chinoise de Hong Kong, conçue pour la détection du visage dans des situations difficiles.

Le système a été évalué par rapport à quatre références de reconnaissance faciale: IJB-B, IJB-C, IJB-S et Tinyface. Le CFSM a été formé avec environ 10% des données MS-Celeb-1M, environ 0,4 million d'images, pour 125 000 itérations à une taille de lot de 32 en utilisant l'optimiseur ADAM avec un taux d'apprentissage de 1E-4.

Le modèle de reconnaissance faciale cible a utilisé une Resnet-50 modifiée avec une fonction de perte d'arc. Un modèle supplémentaire a été formé avec CFSM pour comparaison, étiqueté comme «Arcface» dans les résultats.

Résultats des tests primaires pour CFSM. Les nombres plus élevés sont meilleurs. * Résultats des tests primaires pour CFSM. Les nombres plus élevés sont meilleurs. *

Les résultats ont montré que le modèle d'arc, amélioré par CFSM, a surpassé toutes les lignes de base dans les tâches d'identification et de vérification du visage, atteignant de nouvelles performances de pointe.

La capacité d'extraire des domaines de diverses caractéristiques des systèmes de surveillance héritée permet également de comparer et d'évaluer la similitude de la distribution entre ces systèmes, se présentant chacun en termes de style visuel qui peut être exploité dans les travaux futurs.

Des exemples de divers ensembles de données présentent des différences de style claires. * Des exemples de divers ensembles de données présentent des différences de style claires. *

Les auteurs ont également noté que CFSM montre comment la manipulation adversaire peut être utilisée pour augmenter les précisions de reconnaissance dans les tâches de vision. Ils ont introduit une métrique de similitude de jeu de données basée sur des bases de style apprises, capturant les différences de style dans une étiquette ou une manière prédictive-agnostique.

La recherche souligne le potentiel des modèles de synthèse du visage contrôlables et guidés pour la reconnaissance faciale non contrainte et donne un aperçu des différences de jeu de données.

Article connexe
우리가 도시를 사용하여 도시가 극도의 열을 다루도록 돕는 방법 우리가 도시를 사용하여 도시가 극도의 열을 다루도록 돕는 방법 2024 년은 2023 년을 넘어서는 가장 인기있는 해의 기록을 깨뜨릴 수있을 것 같습니다.이 추세는 도시 열 섬에 사는 사람들에게 특히 힘든 일입니다. 콘크리트와 아스팔트가 태양 광선을 흡수 한 다음 열을 다시 방출하는 도시의 반점입니다. 이 지역은 따뜻할 수 있습니다
'저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다 '저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다 미시간 주립 대학의 연구원들은 이미지 인식 시스템의 정확성을 강화하는 고귀한 원인을 위해 합성 얼굴을 사용하는 혁신적인 방법을 제시했습니다. Deepfakes 현상에 기여하는 대신, 이러한 합성면은 실제에서 발견되는 결점을 모방하도록 설계되었습니다.
Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다 Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다 AI 보상 모델에서 DeepSeek의 획기적인 발전 : AI 추론 및 대응 강화 중국 AI 스타트 업 DeepSeek는 Tsinghua University와 협력하여 AI 연구에서 중요한 이정표를 달성했습니다. AI 보상 모델에 대한 혁신적인 접근 방식은 AI 시스템이 학습하는 방식에 혁명을 약속합니다.
commentaires (10)
0/200
LarryWilliams
LarryWilliams 25 avril 2025 00:00:00 UTC

This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓

FrankJackson
FrankJackson 26 avril 2025 00:00:00 UTC

合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏

MatthewGonzalez
MatthewGonzalez 27 avril 2025 00:00:00 UTC

Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍

CharlesJohnson
CharlesJohnson 27 avril 2025 00:00:00 UTC

¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌

HarryMartínez
HarryMartínez 26 avril 2025 00:00:00 UTC

Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍

LawrencePerez
LawrencePerez 26 avril 2025 00:00:00 UTC

This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨

Retour en haut
OR