Option
Heim
Nachricht
'Erniedrigte' synthetische Gesichter können die Gesichtserkennungstechnologie verbessern

'Erniedrigte' synthetische Gesichter können die Gesichtserkennungstechnologie verbessern

25. April 2025
77

Forscher der Michigan State University haben eine innovative Möglichkeit, synthetische Gesichter für eine edle Sache zu verwenden - die Genauigkeit von Bilderkennungssystemen zu verbessern. Anstatt zum Phänomen der Deepfakes beizutragen, sind diese synthetischen Gesichter so ausgelegt, dass sie die Unvollkommenheiten im realen Videoüberwachungsmaterial nachahmen.

Das Team hat ein kontrollierbares Gesichtssynthesemodul (CFSM) entwickelt, das Gesichter in einem Stil regenerieren kann, der die typischen Fehler von CCTV -Systemen wie Gesichtsunschärfe, geringe Auflösung und Sensorrauschen widerspiegelt. Dieser Ansatz unterscheidet sich von der Verwendung hochwertiger Promi-Bilder aus beliebten Datensätzen, die die realen Herausforderungen nicht erfassen, denen sich Gesichtserkennungssysteme gegenübersehen.

Konzeptionelle Architektur für das kontrollierbare Gesichtssynthesemodul (CFSM). Quelle: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022.pdf * Konzeptuelle Architektur für das kontrollierbare Gesichtssynthesemodul (CFSM).* Quelle: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022.pdf

Im Gegensatz zu DeepFake -Systemen, die sich auf die Replikation von Kopfposen und Ausdrücken konzentrieren, zielt CFSM darauf ab, alternative Ansichten zu generieren, die dem Stil des Zielerkennungssystems durch Style Transfer entsprechen. Dieses Modul ist besonders nützlich, um sich an Legacy -Systeme anzupassen, die aufgrund von Kostenbeschränkungen unwahrscheinlich sind, aber dennoch zu modernen Technologien der Gesichtserkennung beitragen müssen.

Beim Testen von CFSM beobachteten die Forscher signifikante Verbesserungen der Bilderkennungssysteme, die sich mit Daten von geringer Qualität befassten. Sie entdeckten auch einen unerwarteten Vorteil: die Fähigkeit, Zieldatensätze zu charakterisieren und zu vergleichen, was den Prozess des Benchmarkierens und das Erstellen maßgeschneiderter Datensätze für verschiedene CCTV -Systeme vereinfacht.

Schulung der Gesichtserkennungsmodelle, um sich an die Grenzen der Zielsysteme anzupassen. Quelle: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022_supp.pdf * Schulung der Gesichtserkennungsmodelle, um sich an die Einschränkungen der Zielsysteme anzupassen.* Quelle: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022_supp.pdf

Die Methode kann auch auf vorhandene Datensätze angewendet werden, um die Domänenanpassung effektiv durchzuführen, um sie für die Gesichtserkennung besser geeignet zu machen. Die Forschung mit dem Titel ** Controllable und Guided Face Synthese für nicht eingeschränkte Gesichtserkennung ** wird teilweise vom US -amerikanischen Büro des Direktors der nationalen Intelligenz (ODNI bei IARPA) unterstützt und umfasst vier Forscher der Abteilung für Informatik- und Ingenieurwesen der MSU.

Minderwertige Gesichtserkennung: Ein wachsendes Feld

In den letzten Jahren hat sich eine minderwertige Gesichtserkennung (LQFR) als bedeutende Untersuchungsgebiet herausgestellt. Viele ältere Videoüberwachungssysteme, die als langlebig und langlebig gebaut wurden, sind veraltet und haben sich aufgrund technischer Schulden als effektive Datenquellen für maschinelles Lernen kämpfen.

Variierende Maßnahmen der Gesichtsauflösung in einer Reihe historischer und neuerer Videoüberwachungssysteme. Quelle: https://arxiv.org/pdf/1805.11519.pdf Variierende Maßnahmen der Gesichtsauflösung in einer Reihe historischer und neuerer Videoüberwachungssysteme. Quelle: https://arxiv.org/pdf/1805.11519.pdf

Zum Glück sind Diffusionsmodelle und andere rauschbasierte Modelle gut geeignet, um dieses Problem anzugehen. Viele der neuesten Bildsynthesesysteme umfassen im Rahmen ihres Prozesses hochauflösende Bilder mit niedriger Auflösung, was auch für neuronale Komprimierungstechniken von entscheidender Bedeutung ist.

Die Herausforderung bei der Gesichtserkennung besteht darin, die Genauigkeit mit den wenigsten möglichen Merkmalen zu maximieren, die aus Bildern mit niedriger Auflösung extrahiert werden. Dies ist nicht nur nützlich, um Gesichter bei niedriger Auflösung zu identifizieren, sondern auch aufgrund der Einschränkungen der Bildgröße im latenten Raum der Trainingsmodelle erforderlich.

In Computer Vision beziehen sich 'Features' auf die Unterscheidung von Eigenschaften von jedem Bild, nicht nur auf Gesichter. Angesichts der Weiterentwicklung von Hochskalierungsalgorithmen wurden verschiedene Methoden vorgeschlagen, um das Überwachungsmaterial mit geringer Auflösung zu verbessern, was möglicherweise für rechtliche Zwecke wie Ermittlungen des Tatorts verwendet werden kann.

Es besteht jedoch das Risiko einer Fehlidentifizierung, und im Idealfall sollten Gesichtserkennungssysteme keine hochauflösenden Bilder erfordern, um genaue Identifikationen zu erstellen. Solche Transformationen sind teuer und werfen Fragen zu ihrer Gültigkeit und Legalität auf.

Die Notwendigkeit mehr 'Down-at-Heel' Prominente

Es wäre vorteilhafter, wenn Gesichtserkennungssysteme Merkmale direkt aus der Ausgabe von Legacy -Systemen extrahieren könnten, ohne die Bilder zu transformieren. Dies erfordert ein besseres Verständnis der Beziehung zwischen hochauflösenden Identitäten und den erniedrigten Bildern aus vorhandenen Überwachungssystemen.

Das Problem liegt in den Standards: Datensätze wie MS-CELEB-1M und Webface260M werden häufig verwendet, da sie konsistente Benchmarks bieten. Die Autoren argumentieren jedoch, dass Gesichtserkennungsalgorithmen, die auf diesen Datensätzen geschult wurden, nicht für die visuellen Bereiche älterer Überwachungssysteme geeignet sind.

Beispiele aus Microsofts beliebtem MS-CELEB1M-Datensatz. Quelle: https://www.microsoft.com/en-us/research/project/ms-celeb-calenge-recognizing-one-million-celebities-real-world/ * Beispiele aus Microsofts beliebtem MS-Celeb1m-Datensatz.

Das Papier zeigt, dass modernste Gesichtserkennungsmodelle aufgrund von Domänenverschiebungsproblemen mit realen Überwachungsbildern zu kämpfen haben. Diese Modelle werden auf halbbeschränkten Datensätzen geschult, denen die Variationen in realen Szenarien wie Sensorgeräuschen und Bewegungsunschärfe fehlen.

Frühere Methoden haben versucht, die Ausgänge historischer oder kostengünstiger Überwachungssysteme abzustimmen, aber diese waren "blinde" Augmentationen. Im Gegensatz dazu verwendet CFSM während des Trainings ein direktes Feedback aus dem Zielsystem und passt sich durch den Stiltransfer an diese Domäne an.

Die Schauspielerin Natalie Portman, kein Fremder für die Handvoll Datensätze, die die Computer-Vision-Community dominieren, zeigt in diesem Beispiel in diesem Beispiel von CFSM, die stilleichte Domänenanpassung basierend auf der Rückmeldung aus der Domäne des tatsächlichen Zielmodells durchführt. *Die Schauspielerin Natalie Portman, kein Fremder für die Handvoll Datensätze, die die Computer-Vision-Community dominieren, fasst sich in diesem Beispiel in diesem Beispiel von CFSM um, um eine stilbezogene Domänenanpassung basierend auf der Feedback aus der Domäne des tatsächlichen Zielmodells auszuführen.**

Die Architektur der Autoren verwendet die Fast Gradient Sign Method (FGSM), um Stile und Eigenschaften aus der Ausgabe des Zielsystems zu importieren. Im Laufe des Trainings wird der Teil der Pipeline im Bildgenerierung dem Zielsystem treu und verbessert die Funktionen der Gesichtserkennung und die Verallgemeinerungsfunktionen.

Tests und Ergebnisse

Die Forscher testeten CFSM mit früheren Arbeiten von MSU als Vorlage unter Verwendung von MS-CELEB-1M und MS1M-V2 als Trainingsdatensätze. Die Zieldaten waren der umfassendere Datensatz der chinesischen Universität Hongkong, das für die Erkennung von Gesicht in herausfordernden Situationen ausgelegt ist.

Das System wurde gegen vier Gesichtserkennungsbenchmarks bewertet: IJB-B, IJB-C, IJB-S und Tinyface. CFSM wurde mit etwa 10% der MS-Celeb-1M-Daten, rund 0,4 Millionen Bilder, für 125.000 Iterationen mit einer Chargengröße von 32 ausgebildet, wobei der Adam-Optimierer mit einer Lernrate von 1E-4 verwendet wurde.

Das Ziel-Gesichtserkennungsmodell verwendete eine modifizierte Resnet-50 mit Arcface-Verlustfunktion. Ein zusätzliches Modell wurde zum Vergleich mit CFSM trainiert, das in den Ergebnissen als "Arcface" bezeichnet wurde.

Ergebnisse aus den Primärtests für CFSM. Höhere Zahlen sind besser. *Ergebnisse aus den Primärtests für CFSM. Höhere Zahlen sind besser.*

Die Ergebnisse zeigten, dass das durch CFSM verbesserte Arcface-Modell alle Baselines sowohl bei der Gesichtsidentifizierung als auch bei Überprüfungsaufgaben übertroffen hat und neue hochmoderne Leistung erzielte.

Die Fähigkeit, Domänen aus verschiedenen Merkmalen von Legacy -Überwachungssystemen zu extrahieren, ermöglicht auch den Vergleich und Bewertung der Verteilungsähnlichkeit zwischen diesen Systemen, wobei sie jeweils in Bezug auf einen visuellen Stil darstellen, der in zukünftigen Arbeiten genutzt werden kann.

Beispiele aus verschiedenen Datensätzen zeigen klare Stilunterschiede. *Beispiele aus verschiedenen Datensätzen zeigen klare Stilunterschiede.*

Die Autoren stellten auch fest, dass CFSM demonstriert, wie kontrovers manipuliert werden kann, um die Erkennungsgenauigkeiten bei Sichtaufgaben zu erhöhen. Sie führten eine Datensatz-Ähnlichkeitsmetrik ein, die auf gelernten Stilbasen basiert und Stilunterschiede in einer Etikett- oder Prädiktor-agnostische Weise erfasst.

Die Forschung unterstreicht das Potenzial für kontrollierbare und geführte Gesichtssynthesemodelle für die Erkennung nicht eingeschränkter Gesicht und bietet Einblicke in Datensatzunterschiede.

Verwandter Artikel
우리가 도시를 사용하여 도시가 극도의 열을 다루도록 돕는 방법 우리가 도시를 사용하여 도시가 극도의 열을 다루도록 돕는 방법 2024 년은 2023 년을 넘어서는 가장 인기있는 해의 기록을 깨뜨릴 수있을 것 같습니다.이 추세는 도시 열 섬에 사는 사람들에게 특히 힘든 일입니다. 콘크리트와 아스팔트가 태양 광선을 흡수 한 다음 열을 다시 방출하는 도시의 반점입니다. 이 지역은 따뜻할 수 있습니다
'저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다 '저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다 미시간 주립 대학의 연구원들은 이미지 인식 시스템의 정확성을 강화하는 고귀한 원인을 위해 합성 얼굴을 사용하는 혁신적인 방법을 제시했습니다. Deepfakes 현상에 기여하는 대신, 이러한 합성면은 실제에서 발견되는 결점을 모방하도록 설계되었습니다.
Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다 Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다 AI 보상 모델에서 DeepSeek의 획기적인 발전 : AI 추론 및 대응 강화 중국 AI 스타트 업 DeepSeek는 Tsinghua University와 협력하여 AI 연구에서 중요한 이정표를 달성했습니다. AI 보상 모델에 대한 혁신적인 접근 방식은 AI 시스템이 학습하는 방식에 혁명을 약속합니다.
Kommentare (10)
0/200
LarryWilliams
LarryWilliams 25. April 2025 00:00:00 GMT

This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓

FrankJackson
FrankJackson 26. April 2025 00:00:00 GMT

合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏

MatthewGonzalez
MatthewGonzalez 27. April 2025 00:00:00 GMT

Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍

CharlesJohnson
CharlesJohnson 27. April 2025 00:00:00 GMT

¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌

HarryMartínez
HarryMartínez 26. April 2025 00:00:00 GMT

Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍

LawrencePerez
LawrencePerez 26. April 2025 00:00:00 GMT

This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨

Zurück nach oben
OR