「分解された」合成面は、顔認識技術を強化する可能性があります
ミシガン州立大学の研究者は、画像認識システムの精度を強化するために、高貴な大義のために合成面を使用する革新的な方法を思いつきました。ディープフェイクの現象に貢献する代わりに、これらの合成面は、実際のビデオ監視映像に見られる欠陥を模倣するように設計されています。
チームは、顔のぼかし、低解像度、センサーノイズなどのCCTVシステムの典型的な欠陥を反映するスタイルで顔を再生できる制御可能なフェイス合成モジュール(CFSM)を開発しました。このアプローチは、人気のあるデータセットから高品質の有名人の画像を使用することとは異なります。これは、顔認識システムが直面する実際の課題を把握していません。
*制御可能なフェイス合成モジュール(CFSM)の概念アーキテクチャ。
ヘッドポーズや表現の複製に焦点を当てたディープファークシステムとは異なり、CFSMは、スタイル転送を通じてターゲット認識システムのスタイルに一致する代替ビューを生成することを目指しています。このモジュールは、コストの制約のためにアップグレードされる可能性が低いが、現代の顔認識技術に貢献する必要があるレガシーシステムへの適応に特に役立ちます。
CFSMをテストするとき、研究者は、低品質のデータを扱う画像認識システムの大幅な改善を観察しました。また、予期せぬ利点も発見しました。これにより、ターゲットデータセットを特徴付けて比較する能力があります。これにより、さまざまなCCTVシステムのベンチマークとテーラードデータセットの作成プロセスが簡素化されます。
*ターゲットシステムの制限に適応するための顔認識モデルのトレーニング
この方法は、既存のデータセットにも適用し、顔面認識に適したドメイン適応を効果的に実行することもできます。コントロール可能であり、制約不能な顔認識のためのガイド付きフェイス合成**というタイトルの研究は、米国国家情報局長(ODNI、IARPA)によって部分的にサポートされており、MSUのコンピューターサイエンス&エンジニアリング部門の4人の研究者が関与しています。
低品質の顔認識:成長分野
過去数年にわたって、低品質の顔認識(LQFR)は重要な研究分野として浮上してきました。耐久性があり、長持ちするように構築された多くの古いビデオ監視システムは時代遅れになり、技術的な負債により機械学習の効果的なデータソースとして役立つことに苦労しています。
さまざまな歴史的および最近のビデオ監視システムにわたるさまざまなレベルの顔の解像度。出典:https://arxiv.org/pdf/1805.11519.pdf
幸いなことに、拡散モデルやその他のノイズベースのモデルは、この問題に対処するのに適しています。最新の画像合成システムの多くには、プロセスの一部として低解像度画像のアップスケーリングが含まれています。これは、神経圧縮技術にも重要です。
顔認識の課題は、低解像度の画像から抽出された可能な限り少ない機能を使用して精度を最大化することです。これは、低解像度で顔を識別するのに役立つだけでなく、トレーニングモデルの潜在スペースの画像サイズの制限のために必要です。
コンピュータービジョンでは、「特徴」とは、顔だけでなく、任意の画像からの特性を区別することを指します。アップスケーリングアルゴリズムの進歩により、低解像度の監視映像を強化するためのさまざまな方法が提案されており、犯罪現場の調査などの法的目的で使用できる可能性があります。
ただし、誤認のリスクがあり、理想的には、顔認識システムは正確な識別を行うために高解像度の画像を必要としないはずです。このような変換は費用がかかり、その有効性と合法性について疑問を投げかけます。
より多くの「かかとの」有名人の必要性
顔認識システムが画像を変換する必要なく、レガシーシステムの出力から直接機能を抽出できる場合、より有益です。これには、高解像度のアイデンティティと既存の監視システムからの劣化した画像との関係をよりよく理解する必要があります。
問題は標準にあります。MS-CELEB-1MやWebface260Mなどのデータセットは、一貫したベンチマークを提供するため、広く使用されています。ただし、著者らは、これらのデータセットで訓練された顔の認識アルゴリズムは、古い監視システムの視覚ドメインには適していないと主張しています。
* Microsoftの人気のMS-CELEB1Mデータセットの例
この論文は、最先端の顔認識モデルがドメインシフトの問題による実世界の監視画像と闘っていることを強調しています。これらのモデルは、センサーノイズやモーションブラーなど、実際のシナリオに見られるバリエーションがない半構成データセットでトレーニングされています。
以前の方法では、履歴または低コストの監視システムの出力と一致しようとしましたが、これらは「盲目」の増強でした。対照的に、CFSMはトレーニング中にターゲットシステムからの直接フィードバックを使用し、スタイル転送を介してそのドメインを模倣して適応します。
*女優のナタリー・ポートマンは、コンピュータービジョンコミュニティを支配する少数のデータセットに慣れていないため、実際のターゲットモデルのドメインからのフィードバックに基づいて、CFSMを実行するスタイルが一致したドメイン適応を実行するこの例のアイデンティティの1つです。
著者のアーキテクチャは、高速グラデーションサイン法(FGSM)を使用して、ターゲットシステムの出力からスタイルと特性をインポートします。トレーニングが進むにつれて、パイプラインの画像生成部分はターゲットシステムに対してより忠実になり、顔認識のパフォーマンスと一般化機能が向上します。
テストと結果
研究者は、MSUの以前の研究をテンプレートとして使用してCFSMをテストし、MS-CELEB-1MおよびMS1M-V2をトレーニングデータセットとして採用しました。ターゲットデータは、香港の中国大学のより広いフェイスデータセットで、困難な状況で顔を検出するために設計されていました。
このシステムは、IJB-B、IJB-C、IJB-S、およびTinyfaceの4つの顔認識ベンチマークに対して評価されました。 CFSMは、MS-CELEB-1Mデータの約10%、約440万枚の画像でトレーニングされ、Adam Optimizerを使用して1E-4の学習率を使用して32のバッチサイズで125,000回の反復を訓練しました。
ターゲットの顔認識モデルは、ARCFACE損失関数を備えた修正されたResNet-50を使用しました。比較のためにCFSMで追加のモデルをトレーニングし、結果で「アークフェイス」とラベル付けされました。
*CFSMの主要なテストの結果。より多くの数が優れています。*
結果は、CFSMによって強化されたアークフェイスモデルが、顔の識別タスクと検証タスクの両方ですべてのベースラインを上回り、新しい最先端のパフォーマンスを達成することを示しました。
レガシーサーベイランスシステムのさまざまな特性からドメインを抽出する機能により、これらのシステム間の分布類似性を比較および評価することもでき、将来の作業でレバレッジできる視覚スタイルの観点からそれぞれを提示します。
*さまざまなデータセットの例は、スタイルの明確な違いを示しています。*
著者らはまた、CFSMが視覚タスクの認識精度を高めるために敵対的な操作をどのように使用できるかを示していることを指摘しました。彼らは、学習したスタイルのベースに基づいてデータセットの類似性メトリックを導入し、ラベルまたは予測因子に依存しない方法でスタイルの違いをキャプチャしました。
この研究は、制約不能な顔認識のための制御可能なガイド付きフェイス合成モデルの可能性を強調し、データセットの違いに関する洞察を提供します。
関連記事
우리가 도시를 사용하여 도시가 극도의 열을 다루도록 돕는 방법
2024 년은 2023 년을 넘어서는 가장 인기있는 해의 기록을 깨뜨릴 수있을 것 같습니다.이 추세는 도시 열 섬에 사는 사람들에게 특히 힘든 일입니다. 콘크리트와 아스팔트가 태양 광선을 흡수 한 다음 열을 다시 방출하는 도시의 반점입니다. 이 지역은 따뜻할 수 있습니다
'저하 된'합성면은 얼굴 인식 기술을 향상시킬 수 있습니다
미시간 주립 대학의 연구원들은 이미지 인식 시스템의 정확성을 강화하는 고귀한 원인을 위해 합성 얼굴을 사용하는 혁신적인 방법을 제시했습니다. Deepfakes 현상에 기여하는 대신, 이러한 합성면은 실제에서 발견되는 결점을 모방하도록 설계되었습니다.
Deepseek의 AIS는 진정한 인간의 욕구를 밝혀냅니다
AI 보상 모델에서 DeepSeek의 획기적인 발전 : AI 추론 및 대응 강화 중국 AI 스타트 업 DeepSeek는 Tsinghua University와 협력하여 AI 연구에서 중요한 이정표를 달성했습니다. AI 보상 모델에 대한 혁신적인 접근 방식은 AI 시스템이 학습하는 방식에 혁명을 약속합니다.
コメント (10)
0/200
LarryWilliams
2025年4月25日 0:00:00 GMT
This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓
0
FrankJackson
2025年4月26日 0:00:00 GMT
合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏
0
MatthewGonzalez
2025年4月27日 0:00:00 GMT
Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍
0
CharlesJohnson
2025年4月27日 0:00:00 GMT
¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌
0
HarryMartínez
2025年4月26日 0:00:00 GMT
Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍
0
LawrencePerez
2025年4月26日 0:00:00 GMT
This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨
0
ミシガン州立大学の研究者は、画像認識システムの精度を強化するために、高貴な大義のために合成面を使用する革新的な方法を思いつきました。ディープフェイクの現象に貢献する代わりに、これらの合成面は、実際のビデオ監視映像に見られる欠陥を模倣するように設計されています。
チームは、顔のぼかし、低解像度、センサーノイズなどのCCTVシステムの典型的な欠陥を反映するスタイルで顔を再生できる制御可能なフェイス合成モジュール(CFSM)を開発しました。このアプローチは、人気のあるデータセットから高品質の有名人の画像を使用することとは異なります。これは、顔認識システムが直面する実際の課題を把握していません。
*制御可能なフェイス合成モジュール(CFSM)の概念アーキテクチャ。
ヘッドポーズや表現の複製に焦点を当てたディープファークシステムとは異なり、CFSMは、スタイル転送を通じてターゲット認識システムのスタイルに一致する代替ビューを生成することを目指しています。このモジュールは、コストの制約のためにアップグレードされる可能性が低いが、現代の顔認識技術に貢献する必要があるレガシーシステムへの適応に特に役立ちます。
CFSMをテストするとき、研究者は、低品質のデータを扱う画像認識システムの大幅な改善を観察しました。また、予期せぬ利点も発見しました。これにより、ターゲットデータセットを特徴付けて比較する能力があります。これにより、さまざまなCCTVシステムのベンチマークとテーラードデータセットの作成プロセスが簡素化されます。
*ターゲットシステムの制限に適応するための顔認識モデルのトレーニング
この方法は、既存のデータセットにも適用し、顔面認識に適したドメイン適応を効果的に実行することもできます。コントロール可能であり、制約不能な顔認識のためのガイド付きフェイス合成**というタイトルの研究は、米国国家情報局長(ODNI、IARPA)によって部分的にサポートされており、MSUのコンピューターサイエンス&エンジニアリング部門の4人の研究者が関与しています。
低品質の顔認識:成長分野
過去数年にわたって、低品質の顔認識(LQFR)は重要な研究分野として浮上してきました。耐久性があり、長持ちするように構築された多くの古いビデオ監視システムは時代遅れになり、技術的な負債により機械学習の効果的なデータソースとして役立つことに苦労しています。
さまざまな歴史的および最近のビデオ監視システムにわたるさまざまなレベルの顔の解像度。出典:https://arxiv.org/pdf/1805.11519.pdf
幸いなことに、拡散モデルやその他のノイズベースのモデルは、この問題に対処するのに適しています。最新の画像合成システムの多くには、プロセスの一部として低解像度画像のアップスケーリングが含まれています。これは、神経圧縮技術にも重要です。
顔認識の課題は、低解像度の画像から抽出された可能な限り少ない機能を使用して精度を最大化することです。これは、低解像度で顔を識別するのに役立つだけでなく、トレーニングモデルの潜在スペースの画像サイズの制限のために必要です。
コンピュータービジョンでは、「特徴」とは、顔だけでなく、任意の画像からの特性を区別することを指します。アップスケーリングアルゴリズムの進歩により、低解像度の監視映像を強化するためのさまざまな方法が提案されており、犯罪現場の調査などの法的目的で使用できる可能性があります。
ただし、誤認のリスクがあり、理想的には、顔認識システムは正確な識別を行うために高解像度の画像を必要としないはずです。このような変換は費用がかかり、その有効性と合法性について疑問を投げかけます。
より多くの「かかとの」有名人の必要性
顔認識システムが画像を変換する必要なく、レガシーシステムの出力から直接機能を抽出できる場合、より有益です。これには、高解像度のアイデンティティと既存の監視システムからの劣化した画像との関係をよりよく理解する必要があります。
問題は標準にあります。MS-CELEB-1MやWebface260Mなどのデータセットは、一貫したベンチマークを提供するため、広く使用されています。ただし、著者らは、これらのデータセットで訓練された顔の認識アルゴリズムは、古い監視システムの視覚ドメインには適していないと主張しています。
* Microsoftの人気のMS-CELEB1Mデータセットの例
この論文は、最先端の顔認識モデルがドメインシフトの問題による実世界の監視画像と闘っていることを強調しています。これらのモデルは、センサーノイズやモーションブラーなど、実際のシナリオに見られるバリエーションがない半構成データセットでトレーニングされています。
以前の方法では、履歴または低コストの監視システムの出力と一致しようとしましたが、これらは「盲目」の増強でした。対照的に、CFSMはトレーニング中にターゲットシステムからの直接フィードバックを使用し、スタイル転送を介してそのドメインを模倣して適応します。
*女優のナタリー・ポートマンは、コンピュータービジョンコミュニティを支配する少数のデータセットに慣れていないため、実際のターゲットモデルのドメインからのフィードバックに基づいて、CFSMを実行するスタイルが一致したドメイン適応を実行するこの例のアイデンティティの1つです。
著者のアーキテクチャは、高速グラデーションサイン法(FGSM)を使用して、ターゲットシステムの出力からスタイルと特性をインポートします。トレーニングが進むにつれて、パイプラインの画像生成部分はターゲットシステムに対してより忠実になり、顔認識のパフォーマンスと一般化機能が向上します。
テストと結果
研究者は、MSUの以前の研究をテンプレートとして使用してCFSMをテストし、MS-CELEB-1MおよびMS1M-V2をトレーニングデータセットとして採用しました。ターゲットデータは、香港の中国大学のより広いフェイスデータセットで、困難な状況で顔を検出するために設計されていました。
このシステムは、IJB-B、IJB-C、IJB-S、およびTinyfaceの4つの顔認識ベンチマークに対して評価されました。 CFSMは、MS-CELEB-1Mデータの約10%、約440万枚の画像でトレーニングされ、Adam Optimizerを使用して1E-4の学習率を使用して32のバッチサイズで125,000回の反復を訓練しました。
ターゲットの顔認識モデルは、ARCFACE損失関数を備えた修正されたResNet-50を使用しました。比較のためにCFSMで追加のモデルをトレーニングし、結果で「アークフェイス」とラベル付けされました。
*CFSMの主要なテストの結果。より多くの数が優れています。*
結果は、CFSMによって強化されたアークフェイスモデルが、顔の識別タスクと検証タスクの両方ですべてのベースラインを上回り、新しい最先端のパフォーマンスを達成することを示しました。
レガシーサーベイランスシステムのさまざまな特性からドメインを抽出する機能により、これらのシステム間の分布類似性を比較および評価することもでき、将来の作業でレバレッジできる視覚スタイルの観点からそれぞれを提示します。
*さまざまなデータセットの例は、スタイルの明確な違いを示しています。*
著者らはまた、CFSMが視覚タスクの認識精度を高めるために敵対的な操作をどのように使用できるかを示していることを指摘しました。彼らは、学習したスタイルのベースに基づいてデータセットの類似性メトリックを導入し、ラベルまたは予測因子に依存しない方法でスタイルの違いをキャプチャしました。
この研究は、制約不能な顔認識のための制御可能なガイド付きフェイス合成モデルの可能性を強調し、データセットの違いに関する洞察を提供します。



This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓




合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏




Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍




¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌




Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍




This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨












