Las caras sintéticas 'degradadas' pueden mejorar la tecnología de reconocimiento facial
Los investigadores de la Universidad Estatal de Michigan han presentado una forma innovadora de usar caras sintéticas para una causa noble, lo que aumenta la precisión de los sistemas de reconocimiento de imágenes. En lugar de contribuir al fenómeno de Deepfakes, estas caras sintéticas están diseñadas para imitar las imperfecciones que se encuentran en las imágenes de video vigilancia del mundo real.
El equipo ha desarrollado un módulo de síntesis de cara controlable (CFSM) que puede regenerar caras en un estilo que refleja los defectos típicos de los sistemas de CCTV, como el desenfoque facial, la baja resolución y el ruido del sensor. Este enfoque difiere del uso de imágenes de celebridades de alta calidad de conjuntos de datos populares, que no capturan los desafíos del mundo real que enfrentan los sistemas de reconocimiento facial.
* Arquitectura conceptual para el módulo de síntesis de cara controlable (CFSM).* Fuente: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022.pdf
A diferencia de los sistemas Deepfake que se centran en replicar las posturas y las expresiones de la cabeza, CFSM tiene como objetivo generar vistas alternativas que coincidan con el estilo del sistema de reconocimiento de objetivos a través de la transferencia de estilo. Este módulo es particularmente útil para adaptarse a los sistemas heredados que es poco probable que se actualicen debido a limitaciones de costos, pero que aún necesitan contribuir a las tecnologías modernas de reconocimiento facial.
Al probar CFSM, los investigadores observaron mejoras significativas en los sistemas de reconocimiento de imágenes que tratan con datos de baja calidad. También descubrieron un beneficio inesperado: la capacidad de caracterizar y comparar conjuntos de datos de objetivos, lo que simplifica el proceso de evaluación comparativa y creación de conjuntos de datos a medida para varios sistemas de CCTV.
* Entrenamiento de los modelos de reconocimiento facial para adaptarse a las limitaciones de los sistemas de destino.* Fuente: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022_supp.pdf
El método también se puede aplicar a los conjuntos de datos existentes, realizando efectivamente la adaptación del dominio para que sean más adecuados para el reconocimiento facial. La investigación, titulada ** Síntesis de la cara controlable y guiada para el reconocimiento facial sin restricciones **, cuenta parcialmente apoyada por la Oficina de los Estados Unidos del Director de Inteligencia Nacional (ODNI, AT IARPA) e involucra a cuatro investigadores del Departamento de Ciencias e Ingeniería de la Computación de MSU.
Reconocimiento facial de baja calidad: un campo en crecimiento
En los últimos años, el reconocimiento facial de baja calidad (LQFR) ha surgido como un área significativa de estudio. Muchos sistemas de videovigilancia más antiguos, creados para ser duraderos y duraderos, se han vuelto anticuados y luchan por servir como fuentes de datos efectivas para el aprendizaje automático debido a la deuda técnica.
Varios niveles de resolución facial en una variedad de sistemas de videovigilancia históricos y más recientes. Fuente: https://arxiv.org/pdf/1805.11519.pdf
F Afortunadamente, los modelos de difusión y otros modelos basados en ruido son adecuados para abordar este problema. Muchos de los últimos sistemas de síntesis de imágenes incluyen imágenes de baja resolución de alta resolución como parte de su proceso, que también es crucial para las técnicas de compresión neural.
El desafío en el reconocimiento facial es maximizar la precisión con la menor cantidad de características posibles extraídas de imágenes de baja resolución. Esto no solo es útil para identificar caras a baja resolución, sino también necesaria debido a las limitaciones en el tamaño de la imagen en el espacio latente de los modelos de entrenamiento.
En la visión por computadora, las 'características' se refieren a distinguir las características de cualquier imagen, no solo caras. Con el avance en los algoritmos de escalada, se han propuesto varios métodos para mejorar las imágenes de vigilancia de baja resolución, lo que puede ser utilizable para fines legales como las investigaciones de la escena del crimen.
Sin embargo, existe un riesgo de identificación errónea, e idealmente, los sistemas de reconocimiento facial no deberían requerir imágenes de alta resolución para hacer identificaciones precisas. Tales transformaciones son costosas y plantean preguntas sobre su validez y legalidad.
La necesidad de más celebridades 'bajas'
Sería más beneficioso si los sistemas de reconocimiento facial podrían extraer características directamente de la salida de sistemas heredados sin necesidad de transformar las imágenes. Esto requiere una mejor comprensión de la relación entre las identidades de alta resolución y las imágenes degradadas de los sistemas de vigilancia existentes.
El problema radica en los estándares: los conjuntos de datos como MS-Celeb-1M y Webface260m se usan ampliamente porque proporcionan puntos de referencia consistentes. Sin embargo, los autores argumentan que los algoritmos de reconocimiento facial capacitados en estos conjuntos de datos no son adecuados para los dominios visuales de los sistemas de vigilancia más antiguos.
* Ejemplos del popular conjunto de datos MS-Celeb1M de Microsoft.* Fuente: https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/
El artículo destaca que los modelos de reconocimiento facial de última generación luchan con las imágenes de vigilancia del mundo real debido a problemas de cambio de dominio. Estos modelos están entrenados en conjuntos de datos semi-limitados que carecen de las variaciones que se encuentran en los escenarios del mundo real, como el ruido del sensor y el desenfoque de movimiento.
Los métodos anteriores han tratado de coincidir con los resultados de los sistemas de vigilancia histórica o de bajo costo, pero estos fueron aumentos 'ciegos'. Por el contrario, CFSM utiliza retroalimentación directa del sistema objetivo durante el entrenamiento y se adapta a través de la transferencia de estilo a MIMIC ese dominio.
*La actriz Natalie Portman, no ajena al puñado de conjuntos de datos que dominan la comunidad de visión por computadora, aparece entre las identidades en este ejemplo de CFSM que realiza la adaptación de dominio de estilo CFSM basada en la retroalimentación del dominio del modelo objetivo real*.
La arquitectura de los autores utiliza el método de signo de gradiente rápido (FGSM) para importar estilos y características desde la salida del sistema de destino. A medida que avanza la capacitación, la parte de la generación de imágenes de la tubería se vuelve más fiel al sistema objetivo, mejorando el rendimiento del reconocimiento facial y las capacidades de generalización.
Pruebas y resultados
Los investigadores probaron CFSM utilizando el trabajo previo de MSU como plantilla, empleando MS-CELEB-1M y MS1M-V2 como conjuntos de datos de capacitación. Los datos objetivo eran el conjunto de datos de cara más amplia de la Universidad China de Hong Kong, diseñado para la detección de cara en situaciones desafiantes.
El sistema se evaluó contra cuatro puntos de referencia de reconocimiento facial: IJB-B, IJB-C, IJB-S y Tinyface. El CFSM fue entrenado con aproximadamente el 10% de los datos de MS-Celeb-1M, alrededor de 0,4 millones de imágenes, para 125,000 iteraciones a un tamaño por lotes de 32 utilizando el Optimizer Adam con una tasa de aprendizaje de 1E-4.
El modelo de reconocimiento facial de destino utilizó un resnet-50 modificado con la función de pérdida de la cara arc. Un modelo adicional fue entrenado con CFSM para comparación, etiquetado como 'Arcface' en los resultados.
*Resultados de las pruebas primarias para CFSM. Los números más altos son mejores.*
Los resultados mostraron que el modelo ARCFace, mejorado por CFSM, superó a todas las líneas de base en tareas de identificación y verificación de la cara, logrando un nuevo rendimiento de última generación.
La capacidad de extraer dominios de diversas características de los sistemas de vigilancia heredada también permite comparar y evaluar la similitud de distribución entre estos sistemas, presentando cada uno en términos de un estilo visual que puede aprovecharse en el trabajo futuro.
*Ejemplos de varios conjuntos de datos exhiben diferencias claras en el estilo.*
Los autores también señalaron que CFSM demuestra cómo se puede usar la manipulación adversaria para aumentar las precisiones de reconocimiento en las tareas de visión. Introducieron una métrica de similitud de conjunto de datos basada en bases de estilo aprendidas, capturando las diferencias de estilo de una etiqueta o una forma predictor-agnóstica.
La investigación subraya el potencial de los modelos de síntesis de la cara controlable y guiada para el reconocimiento facial no restringido y proporciona información sobre las diferencias de conjuntos de datos.
Artículo relacionado
우리가 도시를 사용하여 도시가 극도의 열을 다루도록 돕는 방법
2024 년은 2023 년을 넘어서는 가장 인기있는 해의 기록을 깨뜨릴 수있을 것 같습니다.이 추세는 도시 열 섬에 사는 사람들에게 특히 힘든 일입니다. 콘크리트와 아스팔트가 태양 광선을 흡수 한 다음 열을 다시 방출하는 도시의 반점입니다. 이 지역은 따뜻할 수 있습니다
'저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다
미시간 주립 대학의 연구원들은 이미지 인식 시스템의 정확성을 강화하는 고귀한 원인을 위해 합성 얼굴을 사용하는 혁신적인 방법을 제시했습니다. Deepfakes 현상에 기여하는 대신, 이러한 합성면은 실제에서 발견되는 결점을 모방하도록 설계되었습니다.
Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다
AI 보상 모델에서 DeepSeek의 획기적인 발전 : AI 추론 및 대응 강화 중국 AI 스타트 업 DeepSeek는 Tsinghua University와 협력하여 AI 연구에서 중요한 이정표를 달성했습니다. AI 보상 모델에 대한 혁신적인 접근 방식은 AI 시스템이 학습하는 방식에 혁명을 약속합니다.
comentario (10)
0/200
LarryWilliams
25 de abril de 2025 00:00:00 GMT
This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓
0
FrankJackson
26 de abril de 2025 00:00:00 GMT
合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏
0
MatthewGonzalez
27 de abril de 2025 00:00:00 GMT
Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍
0
CharlesJohnson
27 de abril de 2025 00:00:00 GMT
¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌
0
HarryMartínez
26 de abril de 2025 00:00:00 GMT
Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍
0
LawrencePerez
26 de abril de 2025 00:00:00 GMT
This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨
0
Los investigadores de la Universidad Estatal de Michigan han presentado una forma innovadora de usar caras sintéticas para una causa noble, lo que aumenta la precisión de los sistemas de reconocimiento de imágenes. En lugar de contribuir al fenómeno de Deepfakes, estas caras sintéticas están diseñadas para imitar las imperfecciones que se encuentran en las imágenes de video vigilancia del mundo real.
El equipo ha desarrollado un módulo de síntesis de cara controlable (CFSM) que puede regenerar caras en un estilo que refleja los defectos típicos de los sistemas de CCTV, como el desenfoque facial, la baja resolución y el ruido del sensor. Este enfoque difiere del uso de imágenes de celebridades de alta calidad de conjuntos de datos populares, que no capturan los desafíos del mundo real que enfrentan los sistemas de reconocimiento facial.
* Arquitectura conceptual para el módulo de síntesis de cara controlable (CFSM).* Fuente: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022.pdf
A diferencia de los sistemas Deepfake que se centran en replicar las posturas y las expresiones de la cabeza, CFSM tiene como objetivo generar vistas alternativas que coincidan con el estilo del sistema de reconocimiento de objetivos a través de la transferencia de estilo. Este módulo es particularmente útil para adaptarse a los sistemas heredados que es poco probable que se actualicen debido a limitaciones de costos, pero que aún necesitan contribuir a las tecnologías modernas de reconocimiento facial.
Al probar CFSM, los investigadores observaron mejoras significativas en los sistemas de reconocimiento de imágenes que tratan con datos de baja calidad. También descubrieron un beneficio inesperado: la capacidad de caracterizar y comparar conjuntos de datos de objetivos, lo que simplifica el proceso de evaluación comparativa y creación de conjuntos de datos a medida para varios sistemas de CCTV.
* Entrenamiento de los modelos de reconocimiento facial para adaptarse a las limitaciones de los sistemas de destino.* Fuente: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022_supp.pdf
El método también se puede aplicar a los conjuntos de datos existentes, realizando efectivamente la adaptación del dominio para que sean más adecuados para el reconocimiento facial. La investigación, titulada ** Síntesis de la cara controlable y guiada para el reconocimiento facial sin restricciones **, cuenta parcialmente apoyada por la Oficina de los Estados Unidos del Director de Inteligencia Nacional (ODNI, AT IARPA) e involucra a cuatro investigadores del Departamento de Ciencias e Ingeniería de la Computación de MSU.
Reconocimiento facial de baja calidad: un campo en crecimiento
En los últimos años, el reconocimiento facial de baja calidad (LQFR) ha surgido como un área significativa de estudio. Muchos sistemas de videovigilancia más antiguos, creados para ser duraderos y duraderos, se han vuelto anticuados y luchan por servir como fuentes de datos efectivas para el aprendizaje automático debido a la deuda técnica.
Varios niveles de resolución facial en una variedad de sistemas de videovigilancia históricos y más recientes. Fuente: https://arxiv.org/pdf/1805.11519.pdf
F Afortunadamente, los modelos de difusión y otros modelos basados en ruido son adecuados para abordar este problema. Muchos de los últimos sistemas de síntesis de imágenes incluyen imágenes de baja resolución de alta resolución como parte de su proceso, que también es crucial para las técnicas de compresión neural.
El desafío en el reconocimiento facial es maximizar la precisión con la menor cantidad de características posibles extraídas de imágenes de baja resolución. Esto no solo es útil para identificar caras a baja resolución, sino también necesaria debido a las limitaciones en el tamaño de la imagen en el espacio latente de los modelos de entrenamiento.
En la visión por computadora, las 'características' se refieren a distinguir las características de cualquier imagen, no solo caras. Con el avance en los algoritmos de escalada, se han propuesto varios métodos para mejorar las imágenes de vigilancia de baja resolución, lo que puede ser utilizable para fines legales como las investigaciones de la escena del crimen.
Sin embargo, existe un riesgo de identificación errónea, e idealmente, los sistemas de reconocimiento facial no deberían requerir imágenes de alta resolución para hacer identificaciones precisas. Tales transformaciones son costosas y plantean preguntas sobre su validez y legalidad.
La necesidad de más celebridades 'bajas'
Sería más beneficioso si los sistemas de reconocimiento facial podrían extraer características directamente de la salida de sistemas heredados sin necesidad de transformar las imágenes. Esto requiere una mejor comprensión de la relación entre las identidades de alta resolución y las imágenes degradadas de los sistemas de vigilancia existentes.
El problema radica en los estándares: los conjuntos de datos como MS-Celeb-1M y Webface260m se usan ampliamente porque proporcionan puntos de referencia consistentes. Sin embargo, los autores argumentan que los algoritmos de reconocimiento facial capacitados en estos conjuntos de datos no son adecuados para los dominios visuales de los sistemas de vigilancia más antiguos.
* Ejemplos del popular conjunto de datos MS-Celeb1M de Microsoft.* Fuente: https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/
El artículo destaca que los modelos de reconocimiento facial de última generación luchan con las imágenes de vigilancia del mundo real debido a problemas de cambio de dominio. Estos modelos están entrenados en conjuntos de datos semi-limitados que carecen de las variaciones que se encuentran en los escenarios del mundo real, como el ruido del sensor y el desenfoque de movimiento.
Los métodos anteriores han tratado de coincidir con los resultados de los sistemas de vigilancia histórica o de bajo costo, pero estos fueron aumentos 'ciegos'. Por el contrario, CFSM utiliza retroalimentación directa del sistema objetivo durante el entrenamiento y se adapta a través de la transferencia de estilo a MIMIC ese dominio.
*La actriz Natalie Portman, no ajena al puñado de conjuntos de datos que dominan la comunidad de visión por computadora, aparece entre las identidades en este ejemplo de CFSM que realiza la adaptación de dominio de estilo CFSM basada en la retroalimentación del dominio del modelo objetivo real*.
La arquitectura de los autores utiliza el método de signo de gradiente rápido (FGSM) para importar estilos y características desde la salida del sistema de destino. A medida que avanza la capacitación, la parte de la generación de imágenes de la tubería se vuelve más fiel al sistema objetivo, mejorando el rendimiento del reconocimiento facial y las capacidades de generalización.
Pruebas y resultados
Los investigadores probaron CFSM utilizando el trabajo previo de MSU como plantilla, empleando MS-CELEB-1M y MS1M-V2 como conjuntos de datos de capacitación. Los datos objetivo eran el conjunto de datos de cara más amplia de la Universidad China de Hong Kong, diseñado para la detección de cara en situaciones desafiantes.
El sistema se evaluó contra cuatro puntos de referencia de reconocimiento facial: IJB-B, IJB-C, IJB-S y Tinyface. El CFSM fue entrenado con aproximadamente el 10% de los datos de MS-Celeb-1M, alrededor de 0,4 millones de imágenes, para 125,000 iteraciones a un tamaño por lotes de 32 utilizando el Optimizer Adam con una tasa de aprendizaje de 1E-4.
El modelo de reconocimiento facial de destino utilizó un resnet-50 modificado con la función de pérdida de la cara arc. Un modelo adicional fue entrenado con CFSM para comparación, etiquetado como 'Arcface' en los resultados.
*Resultados de las pruebas primarias para CFSM. Los números más altos son mejores.*
Los resultados mostraron que el modelo ARCFace, mejorado por CFSM, superó a todas las líneas de base en tareas de identificación y verificación de la cara, logrando un nuevo rendimiento de última generación.
La capacidad de extraer dominios de diversas características de los sistemas de vigilancia heredada también permite comparar y evaluar la similitud de distribución entre estos sistemas, presentando cada uno en términos de un estilo visual que puede aprovecharse en el trabajo futuro.
*Ejemplos de varios conjuntos de datos exhiben diferencias claras en el estilo.*
Los autores también señalaron que CFSM demuestra cómo se puede usar la manipulación adversaria para aumentar las precisiones de reconocimiento en las tareas de visión. Introducieron una métrica de similitud de conjunto de datos basada en bases de estilo aprendidas, capturando las diferencias de estilo de una etiqueta o una forma predictor-agnóstica.
La investigación subraya el potencial de los modelos de síntesis de la cara controlable y guiada para el reconocimiento facial no restringido y proporciona información sobre las diferencias de conjuntos de datos.



This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓




合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏




Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍




¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌




Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍




This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨












