opção
Lar
Notícias
Os rostos sintéticos 'degradados' podem melhorar a tecnologia de reconhecimento facial

Os rostos sintéticos 'degradados' podem melhorar a tecnologia de reconhecimento facial

25 de Abril de 2025
77

Pesquisadores da Universidade Estadual de Michigan criaram uma maneira inovadora de usar rostos sintéticos por uma causa nobre - aprimorando a precisão dos sistemas de reconhecimento de imagens. Em vez de contribuir para o fenômeno de DeepFakes, esses rostos sintéticos são projetados para imitar as imperfeições encontradas nas imagens de vigilância de vídeo do mundo real.

A equipe desenvolveu um módulo de síntese de face controlável (CFSM) que pode regenerar faces em um estilo que reflete as falhas típicas dos sistemas de CCTV, como desfoque facial, baixa resolução e ruído do sensor. Essa abordagem difere do uso de imagens de celebridades de alta qualidade de conjuntos de dados populares, que não capturam os desafios do mundo real enfrentados pelos sistemas de reconhecimento facial.

Arquitetura conceitual para o módulo de síntese de face controlável (CFSM). Fonte: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022.pdf * Arquitetura conceitual para o módulo de síntese de face controlável (CFSM).

Diferentemente dos sistemas DeepFake que se concentram na replicação de poses e expressões da cabeça, o CFSM visa gerar visualizações alternativas que correspondem ao estilo do sistema de reconhecimento de destino através da transferência de estilo. Este módulo é particularmente útil para se adaptar aos sistemas herdados que dificilmente serão atualizados devido a restrições de custo, mas ainda precisam contribuir para as modernas tecnologias de reconhecimento facial.

Ao testar o CFSM, os pesquisadores observaram melhorias significativas nos sistemas de reconhecimento de imagens que tratam de dados de baixa qualidade. Eles também descobriram um benefício inesperado: a capacidade de caracterizar e comparar conjuntos de dados de destino, que simplifica o processo de benchmarking e criação de conjuntos de dados personalizados para vários sistemas de CCTV.

Treinar os modelos de reconhecimento facial para se adaptar às limitações dos sistemas de destino. Fonte: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022_supp.pdf * Treinando os modelos de reconhecimento facial para se adaptar às limitações dos sistemas de destino.

O método também pode ser aplicado aos conjuntos de dados existentes, executando efetivamente a adaptação do domínio para torná -los mais adequados para o reconhecimento facial. A pesquisa, intitulada ** síntese de face controlável e guiada para reconhecimento de rosto irrestrito **, é parcialmente apoiado pelo Escritório dos EUA do Diretor de Inteligência Nacional (ODNI, na IARPA) e envolve quatro pesquisadores do Departamento de Ciência e Engenharia de Computação da MSU.

Reconhecimento facial de baixa qualidade: um campo em crescimento

Nos últimos anos, o reconhecimento facial de baixa qualidade (LQFR) surgiu como uma área de estudo significativa. Muitos sistemas de vigilância por vídeo mais antigos, construídos para serem duráveis ​​e duradouros, tornaram-se desatualizados e lutam para servir como fontes de dados eficazes para o aprendizado de máquina devido à dívida técnica.

Níveis variados de resolução facial em uma variedade de sistemas de vigilância por vídeo históricos e mais recentes. Fonte: https://arxiv.org/pdf/1805.11519.pdf Níveis variados de resolução facial em uma variedade de sistemas de vigilância por vídeo históricos e mais recentes. Fonte: https://arxiv.org/pdf/1805.11519.pdf

Felizmente, os modelos de difusão e outros modelos baseados em ruído são adequados para resolver esse problema. Muitos dos mais recentes sistemas de síntese de imagem incluem as imagens de baixa resolução como parte de seu processo, o que também é crucial para as técnicas de compressão neural.

O desafio no reconhecimento facial é maximizar a precisão com o menor número de recursos possíveis extraídos de imagens de baixa resolução. Isso não é apenas útil para identificar faces em baixa resolução, mas também necessário devido a limitações no tamanho da imagem no espaço latente dos modelos de treinamento.

Na visão computacional, os 'recursos' referem -se a características distintas de qualquer imagem, não apenas faces. Com o avanço nos algoritmos de aumento da escala, vários métodos foram propostos para melhorar as filmagens de vigilância de baixa resolução, potencialmente tornando-o utilizável para fins legais, como investigações de cenas do crime.

No entanto, existe um risco de identificação incorreta e, idealmente, os sistemas de reconhecimento facial não devem exigir imagens de alta resolução para fazer identificações precisas. Tais transformações são caras e levantam questões sobre sua validade e legalidade.

A necessidade de mais celebridades de 'baixo na heal

Seria mais benéfico se os sistemas de reconhecimento facial pudessem extrair recursos diretamente da saída de sistemas herdados sem a necessidade de transformar as imagens. Isso requer uma melhor compreensão da relação entre identidades de alta resolução e imagens degradadas dos sistemas de vigilância existentes.

O problema está nos padrões: conjuntos de dados como MS-CELEB-1M e WebFace260M são amplamente utilizados porque fornecem benchmarks consistentes. No entanto, os autores argumentam que os algoritmos de reconhecimento facial treinados nesses conjuntos de dados não são adequados para os domínios visuais de sistemas de vigilância mais antigos.

Exemplos do popular conjunto de dados MS-CELEB1M da Microsoft. Fonte: https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrity-real-world/ * Exemplos do popular conjunto de dados MS-CELEB1M da Microsoft.

O artigo destaca que os modelos de reconhecimento facial de ponta lutam com imagens de vigilância do mundo real devido a problemas de mudança de domínio. Esses modelos são treinados em conjuntos de dados semi-restritos que não possuem as variações encontradas em cenários do mundo real, como ruído do sensor e desfoque de movimento.

Métodos anteriores tentaram corresponder aos resultados de sistemas de vigilância histórica ou de baixo custo, mas esses foram aumentados "cegos". Por outro lado, o CFSM usa feedback direto do sistema de destino durante o treinamento e os adaptados por meio de transferência de estilo para imitar esse domínio.

A atriz Natalie Portman, sem estranho para o punhado de conjuntos de dados que dominam a comunidade de visão computacional, características entre as identidades neste exemplo de CFSM executando a adaptação de domínio correspondente ao estilo com base no feedback do domínio do modelo de destino real. *Atriz Natalie Portman, nenhum estranho para o punhado de conjuntos de dados que dominam a comunidade de visão computacional, características entre as identidades neste exemplo do CFSM executando a adaptação de domínio correspondente ao estilo com base no feedback do domínio do modelo de destino real.*

A arquitetura dos autores usa o método de sinal de gradiente rápido (FGSM) para importar estilos e características da saída do sistema de destino. À medida que o treinamento avança, a parte da geração de imagens do pipeline se torna mais fiel ao sistema de destino, melhorando o desempenho do reconhecimento facial e as capacidades de generalização.

Testes e resultados

Os pesquisadores testaram o CFSM usando o trabalho anterior da MSU como modelo, empregando MS-CELEB-1M e MS1M-V2 como conjuntos de dados de treinamento. Os dados de destino eram o conjunto de dados mais amplo da Universidade Chinesa de Hong Kong, projetada para detecção de rosto em situações desafiadoras.

O sistema foi avaliado em relação a quatro benchmarks de reconhecimento de rosto: IJB-B, IJB-C, IJB-S e Tinyface. O CFSM foi treinado com cerca de 10% dos dados MS-CELEB-1M, cerca de 0,4 milhão de imagens, para 125.000 iterações em um tamanho de lotes de 32 usando o otimizador Adam com uma taxa de aprendizado de 1E-4.

O modelo de reconhecimento facial de destino usou um resNet-50 modificado com a função de perda de arcface. Um modelo adicional foi treinado com CFSM para comparação, rotulado como 'arcface' nos resultados.

Resultados dos testes primários para CFSM. Números mais altos são melhores. *Resultados dos testes primários para CFSM. Números mais altos são melhores.*

Os resultados mostraram que o modelo ARCFace, aprimorado pelo CFSM, superou todas as linhas de base nas tarefas de identificação e verificação do rosto, alcançando um novo desempenho de ponta.

A capacidade de extrair domínios de várias características dos sistemas de vigilância herdada também permite comparar e avaliar a similaridade da distribuição entre esses sistemas, apresentando cada um em termos de um estilo visual que pode ser alavancado em trabalhos futuros.

Exemplos de vários conjuntos de dados exibem diferenças claras de estilo. *Exemplos de vários conjuntos de dados exibem diferenças claras de estilo.*

Os autores também observaram que o CFSM demonstra como a manipulação adversária pode ser usada para aumentar as precisões de reconhecimento nas tarefas de visão. Eles introduziram uma métrica de similaridade do conjunto de dados com base em bases de estilo aprendidas, capturando diferenças de estilo em uma etiqueta ou maneira preditora-agnóstica.

A pesquisa ressalta o potencial de modelos de síntese de face controláveis ​​e guiados para o reconhecimento facial irrestrito e fornece informações sobre as diferenças de conjunto de dados.

Artigo relacionado
우리가 도시를 사용하여 도시가 극도의 열을 다루도록 돕는 방법 우리가 도시를 사용하여 도시가 극도의 열을 다루도록 돕는 방법 2024 년은 2023 년을 넘어서는 가장 인기있는 해의 기록을 깨뜨릴 수있을 것 같습니다.이 추세는 도시 열 섬에 사는 사람들에게 특히 힘든 일입니다. 콘크리트와 아스팔트가 태양 광선을 흡수 한 다음 열을 다시 방출하는 도시의 반점입니다. 이 지역은 따뜻할 수 있습니다
'저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다 '저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다 미시간 주립 대학의 연구원들은 이미지 인식 시스템의 정확성을 강화하는 고귀한 원인을 위해 합성 얼굴을 사용하는 혁신적인 방법을 제시했습니다. Deepfakes 현상에 기여하는 대신, 이러한 합성면은 실제에서 발견되는 결점을 모방하도록 설계되었습니다.
Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다 Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다 AI 보상 모델에서 DeepSeek의 획기적인 발전 : AI 추론 및 대응 강화 중국 AI 스타트 업 DeepSeek는 Tsinghua University와 협력하여 AI 연구에서 중요한 이정표를 달성했습니다. AI 보상 모델에 대한 혁신적인 접근 방식은 AI 시스템이 학습하는 방식에 혁명을 약속합니다.
Comentários (10)
0/200
LarryWilliams
LarryWilliams 25 de Abril de 2025 à0 00:00:00 GMT

This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓

FrankJackson
FrankJackson 26 de Abril de 2025 à0 00:00:00 GMT

合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏

MatthewGonzalez
MatthewGonzalez 27 de Abril de 2025 à0 00:00:00 GMT

Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍

CharlesJohnson
CharlesJohnson 27 de Abril de 2025 à0 00:00:00 GMT

¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌

HarryMartínez
HarryMartínez 26 de Abril de 2025 à0 00:00:00 GMT

Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍

LawrencePerez
LawrencePerez 26 de Abril de 2025 à0 00:00:00 GMT

This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨

De volta ao topo
OR