«Униженные» синтетические лица могут улучшить технологию распознавания лиц
Исследователи из Университета штата Мичиган придумали инновационный способ использовать синтетические лица для благородного дела - повышение точности систем распознавания изображений. Вместо того, чтобы вносить свой вклад в явление DeepFakes, эти синтетические лица предназначены для имитации недостатков, обнаруженных в реальных кадрах наблюдения за видео.
Команда разработала контролируемый модуль синтеза лица (CFSM), который может регенерировать лица в стиле, который отражает типичные недостатки систем видеонаблюдения, таких как размытие лица, низкое разрешение и шум датчика. Этот подход отличается от использования высококачественных изображений знаменитостей из популярных наборов данных, которые не отражают реальные проблемы, с которыми сталкиваются системы распознавания лиц.
* Концептуальная архитектура для контролируемого модуля синтеза лица (CFSM).* Источник: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022.pdf
В отличие от систем DeepFake, которые фокусируются на репликации поза и выражения головы, CFSM стремится создать альтернативные представления, которые соответствуют стилю системы распознавания целей посредством переноса стиля. Этот модуль особенно полезен для адаптации к устаревшим системам, которые вряд ли будут обновлены из -за ограничений затрат, но все же необходимо вносить вклад в современные технологии распознавания лица.
При тестировании CFSM исследователи наблюдали значительные улучшения в системах распознавания изображений, касающихся низкокачественных данных. Они также обнаружили неожиданное преимущество: способность характеризовать и сравнивать целевые наборы данных, что упрощает процесс сравнительного анализа и создания индивидуальных наборов данных для различных систем видеонаблюдения.
* Обучение моделей распознавания лица для адаптации к ограничениям целевых систем.* Источник: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022_supp.pdf
Метод также может быть применен к существующим наборам данных, эффективно выполняя адаптацию домены, чтобы сделать их более подходящими для распознавания лиц. Исследование под названием ** Синтез управляемого и управляемого лица для неограниченного распознавания лица **, частично поддерживается Управлением директора национальной разведки США (ODNI, в IARPA) и включает в себя четырех исследователей из департамента компьютерных наук и инженерии МГУ.
Низкокачественное распознавание лица: растущая поле
За последние несколько лет низкокачественное распознавание лиц (LQFR) стало важной областью исследования. Многие старые системы наблюдения за видео, созданные для того, чтобы быть долговечными и долговечными, устарели и борются за то, чтобы служить эффективными источниками данных для машинного обучения из-за технического долга.
Различные уровни разрешения лица в ряде исторических и более поздних систем видеонаблюдения. Источник: https://arxiv.org/pdf/1805.11519.pdf
К счастью, диффузионные модели и другие модели на основе шума хорошо подходят для решения этой проблемы. Многие из новейших систем синтеза изображений включают в себя масштабирующие изображения с низким разрешением в рамках их процесса, что также имеет решающее значение для методов сжатия нервной системы.
Задача в распознавании лица заключается в максимизации точности с наименьшими возможными функциями, извлеченными из изображений с низким разрешением. Это не только полезно для выявления лиц с низким разрешением, но также и необходимо из -за ограничений размера изображения в скрытом пространстве тренировочных моделей.
В компьютерном зрении «функции» относятся к отличительным характеристикам от любого изображения, а не только для лиц. С развитием в алгоритмах масштабирования были предложены различные методы для улучшения кадров наблюдения с низким разрешением, что может сделать его полезным для юридических целей, таких как расследования на месте преступления.
Тем не менее, существует риск неправильной идентификации, и в идеале системы распознавания лиц не должны требовать изображений с высоким разрешением для проведения точных идентификаций. Такие преобразования являются дорогостоящими и поднимают вопросы об их достоверности и законности.
Потребность в более знаменитостях «на кальку»
Было бы более полезно, если бы системы распознавания лиц могли бы извлекать функции непосредственно из вывода устаревших систем без необходимости преобразования изображений. Это требует лучшего понимания взаимосвязи между идентичностями высокого разрешения и деградированными изображениями из существующих систем наблюдения.
Проблема заключается в стандартах: широко используются наборы данных, такие как MS-CELEB-1 и WebFace260M, потому что они обеспечивают последовательные тесты. Тем не менее, авторы утверждают, что алгоритмы распознавания лиц, обученные этим наборам данных, не подходят для визуальных областей старых систем наблюдения.
* Примеры из популярного набора данных MSCELEB1M от Microsoft.
В документе подчеркивается, что современные модели распознавания лиц борются с реальными изображениями наблюдения из-за проблем смены домена. Эти модели обучаются на полусвященных наборах данных, в которых отсутствуют вариации, обнаруженные в реальных сценариях, таких как шум датчика и размытие движения.
Предыдущие методы пытались сопоставить выходы исторических или недорогих систем наблюдения, но это были «слепые» дополнения. Напротив, CFSM использует прямую обратную связь от целевой системы во время обучения и адаптируется посредством переноса стиля, чтобы имитировать этот домен.
*Актриса Натали Портман, не привыкать к горстке наборов данных, которые доминируют в сообществе компьютерного зрения, функции среди идентичностей в этом примере CFSM, выполняющей адаптацию, соответствующую домену в стиле, на основе отзывов из домена фактической целевой модели.*
Архитектура авторов использует метод знака быстрого градиента (FGSM) для импорта стилей и характеристик с вывода целевой системы. По мере продвижения обучения, генерация изображений, часть трубопровода становится более верной целевой системе, улучшая эффективность распознавания лица и возможности обобщения.
Тесты и результаты
Исследователи тестировали CFSM, используя предыдущую работу MSU в качестве шаблона, используя MS-CELEB-1M и MS1M-V2 в качестве наборов данных. Целевые данные представляли собой набор данных Widerface от Китайского университета Гонконга, предназначенного для обнаружения лица в сложных ситуациях.
Система была оценена по четырем критериям распознавания лица: IJB-B, IJB-C, IJB-S и Tinyface. CFSM обучался примерно 10% данных MS-CELEB-1, около 0,4 миллиона изображений, для 125 000 итераций при размере пакетного размера 32 с использованием оптимизатора ADAM с уровнем обучения 1E-4.
Целевая модель распознавания лица использовала модифицированную функцию RESNET-50 с потерей дуги. Дополнительная модель была обучена с помощью CFSM для сравнения, помеченная как «Arcface» в результатах.
*Результаты первичных тестов для CFSM. Более высокие числа лучше.*
Результаты показали, что модель Arcface, улучшенная CFSM, превзошла все базовые показатели как в задачах идентификации, так и проверки, достигнув новой современной производительности.
Способность извлекать домены из различных характеристик устаревших систем наблюдения также позволяет сравнивать и оценивать сходство распределения между этими системами, представляя каждый с точки зрения визуального стиля, который можно использовать в будущей работе.
*Примеры из различных наборов данных демонстрируют четкие различия в стиле.*
Авторы также отметили, что CFSM демонстрирует, как состязательные манипуляции можно использовать для повышения точности распознавания в задачах зрения. Они представили метрику сходства наборов данных, основанную на основаниях обученных стилей, захватывая различия в стиле в марке или предикторе.
Исследование подчеркивает потенциал контролируемых и управляемых моделей синтеза лица для неограниченного распознавания лиц и дает представление о различиях на наборах данных.
Связанная статья
우리가 도시를 사용하여 도시가 극도의 열을 다루도록 돕는 방법
2024 년은 2023 년을 넘어서는 가장 인기있는 해의 기록을 깨뜨릴 수있을 것 같습니다.이 추세는 도시 열 섬에 사는 사람들에게 특히 힘든 일입니다. 콘크리트와 아스팔트가 태양 광선을 흡수 한 다음 열을 다시 방출하는 도시의 반점입니다. 이 지역은 따뜻할 수 있습니다
'저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다
미시간 주립 대학의 연구원들은 이미지 인식 시스템의 정확성을 강화하는 고귀한 원인을 위해 합성 얼굴을 사용하는 혁신적인 방법을 제시했습니다. Deepfakes 현상에 기여하는 대신, 이러한 합성면은 실제에서 발견되는 결점을 모방하도록 설계되었습니다.
Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다
AI 보상 모델에서 DeepSeek의 획기적인 발전 : AI 추론 및 대응 강화 중국 AI 스타트 업 DeepSeek는 Tsinghua University와 협력하여 AI 연구에서 중요한 이정표를 달성했습니다. AI 보상 모델에 대한 혁신적인 접근 방식은 AI 시스템이 학습하는 방식에 혁명을 약속합니다.
Комментарии (10)
LarryWilliams
25 апреля 2025 г., 0:00:00 GMT
This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓
0
FrankJackson
26 апреля 2025 г., 0:00:00 GMT
合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏
0
MatthewGonzalez
27 апреля 2025 г., 0:00:00 GMT
Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍
0
CharlesJohnson
27 апреля 2025 г., 0:00:00 GMT
¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌
0
HarryMartínez
26 апреля 2025 г., 0:00:00 GMT
Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍
0
LawrencePerez
26 апреля 2025 г., 0:00:00 GMT
This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨
0
Исследователи из Университета штата Мичиган придумали инновационный способ использовать синтетические лица для благородного дела - повышение точности систем распознавания изображений. Вместо того, чтобы вносить свой вклад в явление DeepFakes, эти синтетические лица предназначены для имитации недостатков, обнаруженных в реальных кадрах наблюдения за видео.
Команда разработала контролируемый модуль синтеза лица (CFSM), который может регенерировать лица в стиле, который отражает типичные недостатки систем видеонаблюдения, таких как размытие лица, низкое разрешение и шум датчика. Этот подход отличается от использования высококачественных изображений знаменитостей из популярных наборов данных, которые не отражают реальные проблемы, с которыми сталкиваются системы распознавания лиц.
* Концептуальная архитектура для контролируемого модуля синтеза лица (CFSM).* Источник: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022.pdf
В отличие от систем DeepFake, которые фокусируются на репликации поза и выражения головы, CFSM стремится создать альтернативные представления, которые соответствуют стилю системы распознавания целей посредством переноса стиля. Этот модуль особенно полезен для адаптации к устаревшим системам, которые вряд ли будут обновлены из -за ограничений затрат, но все же необходимо вносить вклад в современные технологии распознавания лица.
При тестировании CFSM исследователи наблюдали значительные улучшения в системах распознавания изображений, касающихся низкокачественных данных. Они также обнаружили неожиданное преимущество: способность характеризовать и сравнивать целевые наборы данных, что упрощает процесс сравнительного анализа и создания индивидуальных наборов данных для различных систем видеонаблюдения.
* Обучение моделей распознавания лица для адаптации к ограничениям целевых систем.* Источник: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022_supp.pdf
Метод также может быть применен к существующим наборам данных, эффективно выполняя адаптацию домены, чтобы сделать их более подходящими для распознавания лиц. Исследование под названием ** Синтез управляемого и управляемого лица для неограниченного распознавания лица **, частично поддерживается Управлением директора национальной разведки США (ODNI, в IARPA) и включает в себя четырех исследователей из департамента компьютерных наук и инженерии МГУ.
Низкокачественное распознавание лица: растущая поле
За последние несколько лет низкокачественное распознавание лиц (LQFR) стало важной областью исследования. Многие старые системы наблюдения за видео, созданные для того, чтобы быть долговечными и долговечными, устарели и борются за то, чтобы служить эффективными источниками данных для машинного обучения из-за технического долга.
Различные уровни разрешения лица в ряде исторических и более поздних систем видеонаблюдения. Источник: https://arxiv.org/pdf/1805.11519.pdf
К счастью, диффузионные модели и другие модели на основе шума хорошо подходят для решения этой проблемы. Многие из новейших систем синтеза изображений включают в себя масштабирующие изображения с низким разрешением в рамках их процесса, что также имеет решающее значение для методов сжатия нервной системы.
Задача в распознавании лица заключается в максимизации точности с наименьшими возможными функциями, извлеченными из изображений с низким разрешением. Это не только полезно для выявления лиц с низким разрешением, но также и необходимо из -за ограничений размера изображения в скрытом пространстве тренировочных моделей.
В компьютерном зрении «функции» относятся к отличительным характеристикам от любого изображения, а не только для лиц. С развитием в алгоритмах масштабирования были предложены различные методы для улучшения кадров наблюдения с низким разрешением, что может сделать его полезным для юридических целей, таких как расследования на месте преступления.
Тем не менее, существует риск неправильной идентификации, и в идеале системы распознавания лиц не должны требовать изображений с высоким разрешением для проведения точных идентификаций. Такие преобразования являются дорогостоящими и поднимают вопросы об их достоверности и законности.
Потребность в более знаменитостях «на кальку»
Было бы более полезно, если бы системы распознавания лиц могли бы извлекать функции непосредственно из вывода устаревших систем без необходимости преобразования изображений. Это требует лучшего понимания взаимосвязи между идентичностями высокого разрешения и деградированными изображениями из существующих систем наблюдения.
Проблема заключается в стандартах: широко используются наборы данных, такие как MS-CELEB-1 и WebFace260M, потому что они обеспечивают последовательные тесты. Тем не менее, авторы утверждают, что алгоритмы распознавания лиц, обученные этим наборам данных, не подходят для визуальных областей старых систем наблюдения.
* Примеры из популярного набора данных MSCELEB1M от Microsoft.
В документе подчеркивается, что современные модели распознавания лиц борются с реальными изображениями наблюдения из-за проблем смены домена. Эти модели обучаются на полусвященных наборах данных, в которых отсутствуют вариации, обнаруженные в реальных сценариях, таких как шум датчика и размытие движения.
Предыдущие методы пытались сопоставить выходы исторических или недорогих систем наблюдения, но это были «слепые» дополнения. Напротив, CFSM использует прямую обратную связь от целевой системы во время обучения и адаптируется посредством переноса стиля, чтобы имитировать этот домен.
*Актриса Натали Портман, не привыкать к горстке наборов данных, которые доминируют в сообществе компьютерного зрения, функции среди идентичностей в этом примере CFSM, выполняющей адаптацию, соответствующую домену в стиле, на основе отзывов из домена фактической целевой модели.*
Архитектура авторов использует метод знака быстрого градиента (FGSM) для импорта стилей и характеристик с вывода целевой системы. По мере продвижения обучения, генерация изображений, часть трубопровода становится более верной целевой системе, улучшая эффективность распознавания лица и возможности обобщения.
Тесты и результаты
Исследователи тестировали CFSM, используя предыдущую работу MSU в качестве шаблона, используя MS-CELEB-1M и MS1M-V2 в качестве наборов данных. Целевые данные представляли собой набор данных Widerface от Китайского университета Гонконга, предназначенного для обнаружения лица в сложных ситуациях.
Система была оценена по четырем критериям распознавания лица: IJB-B, IJB-C, IJB-S и Tinyface. CFSM обучался примерно 10% данных MS-CELEB-1, около 0,4 миллиона изображений, для 125 000 итераций при размере пакетного размера 32 с использованием оптимизатора ADAM с уровнем обучения 1E-4.
Целевая модель распознавания лица использовала модифицированную функцию RESNET-50 с потерей дуги. Дополнительная модель была обучена с помощью CFSM для сравнения, помеченная как «Arcface» в результатах.
*Результаты первичных тестов для CFSM. Более высокие числа лучше.*
Результаты показали, что модель Arcface, улучшенная CFSM, превзошла все базовые показатели как в задачах идентификации, так и проверки, достигнув новой современной производительности.
Способность извлекать домены из различных характеристик устаревших систем наблюдения также позволяет сравнивать и оценивать сходство распределения между этими системами, представляя каждый с точки зрения визуального стиля, который можно использовать в будущей работе.
*Примеры из различных наборов данных демонстрируют четкие различия в стиле.*
Авторы также отметили, что CFSM демонстрирует, как состязательные манипуляции можно использовать для повышения точности распознавания в задачах зрения. Они представили метрику сходства наборов данных, основанную на основаниях обученных стилей, захватывая различия в стиле в марке или предикторе.
Исследование подчеркивает потенциал контролируемых и управляемых моделей синтеза лица для неограниченного распознавания лиц и дает представление о различиях на наборах данных.



This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓




合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏




Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍




¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌




Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍




This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨












