'अपमानित' सिंथेटिक चेहरे चेहरे की पहचान तकनीक को बढ़ा सकते हैं
मिशिगन स्टेट यूनिवर्सिटी के शोधकर्ता एक महान कारण के लिए सिंथेटिक चेहरों का उपयोग करने के लिए एक अभिनव तरीके से आए हैं - छवि मान्यता प्रणालियों की सटीकता को बढ़ाते हुए। दीपफेक घटना में योगदान देने के बजाय, इन सिंथेटिक चेहरों को वास्तविक दुनिया के वीडियो निगरानी फुटेज में पाए जाने वाले खामियों की नकल करने के लिए डिज़ाइन किया गया है।
टीम ने एक नियंत्रणीय फेस सिंथेसिस मॉड्यूल (सीएफएसएम) विकसित किया है जो एक शैली में चेहरे को पुन: उत्पन्न कर सकता है जो सीसीटीवी सिस्टम की विशिष्ट खामियों को दर्शाता है, जैसे कि चेहरे का धब्बा, कम रिज़ॉल्यूशन और सेंसर शोर। यह दृष्टिकोण लोकप्रिय डेटासेट से उच्च-गुणवत्ता वाली सेलिब्रिटी छवियों का उपयोग करने से अलग है, जो चेहरे की पहचान प्रणालियों द्वारा सामना की जाने वाली वास्तविक दुनिया की चुनौतियों पर कब्जा नहीं करते हैं।
* नियंत्रणीय फेस सिंथेसिस मॉड्यूल (CFSM) के लिए वैचारिक वास्तुकला।
डीपफेक सिस्टम के विपरीत, जो हेड पोज़ और एक्सप्रेशन की नकल करने पर ध्यान केंद्रित करते हैं, सीएफएसएम का उद्देश्य वैकल्पिक विचारों को उत्पन्न करना है जो स्टाइल ट्रांसफर के माध्यम से लक्ष्य मान्यता प्रणाली की शैली से मेल खाते हैं। यह मॉड्यूल विशेष रूप से विरासत प्रणालियों को अपनाने के लिए उपयोगी है जो लागत की कमी के कारण अपग्रेड होने की संभावना नहीं है, लेकिन फिर भी आधुनिक चेहरे की पहचान प्रौद्योगिकियों में योगदान करने की आवश्यकता है।
CFSM का परीक्षण करते समय, शोधकर्ताओं ने कम गुणवत्ता वाले डेटा से निपटने वाली छवि मान्यता प्रणालियों में महत्वपूर्ण सुधार देखे। उन्होंने एक अप्रत्याशित लाभ की भी खोज की: लक्ष्य डेटासेट को चिह्नित करने और तुलना करने की क्षमता, जो बेंचमार्किंग की प्रक्रिया को सरल बनाती है और विभिन्न सीसीटीवी सिस्टम के लिए सिलवाया डेटासेट बनाती है।
* लक्ष्य प्रणालियों की सीमाओं के अनुकूल होने के लिए चेहरे की पहचान मॉडल को प्रशिक्षित करना।
विधि को मौजूदा डेटासेट पर भी लागू किया जा सकता है, प्रभावी रूप से उन्हें चेहरे की पहचान के लिए अधिक उपयुक्त बनाने के लिए डोमेन अनुकूलन का प्रदर्शन किया जा सकता है। अप्रतिबंधित चेहरे की मान्यता के लिए ** नियंत्रणीय और निर्देशित फेस सिंथेसिस नामक शोध, आंशिक रूप से नेशनल इंटेलिजेंस के निदेशक (IARPA में ODNI) के अमेरिकी कार्यालय द्वारा आंशिक रूप से समर्थित है और इसमें MSU के कंप्यूटर विज्ञान और इंजीनियरिंग विभाग के चार शोधकर्ता शामिल हैं।
कम गुणवत्ता वाला चेहरा मान्यता: एक बढ़ता हुआ क्षेत्र
पिछले कुछ वर्षों में, कम गुणवत्ता वाले चेहरे की पहचान (LQFR) अध्ययन के एक महत्वपूर्ण क्षेत्र के रूप में उभरा है। टिकाऊ और लंबे समय तक चलने वाले कई पुराने वीडियो निगरानी प्रणाली, तकनीकी ऋण के कारण मशीन लर्निंग के लिए प्रभावी डेटा स्रोतों के रूप में सेवा करने के लिए पुरानी और संघर्ष हो गई हैं।
ऐतिहासिक और अधिक हाल के वीडियो निगरानी प्रणालियों की एक श्रृंखला में चेहरे के संकल्प के अलग -अलग स्तर। स्रोत: https://arxiv.org/pdf/1805.11519.pdf
एफ सौभाग्य से, प्रसार मॉडल और अन्य शोर-आधारित मॉडल इस मुद्दे को हल करने के लिए अच्छी तरह से अनुकूल हैं। नवीनतम छवि संश्लेषण प्रणालियों में से कई में उनकी प्रक्रिया के हिस्से के रूप में कम-रिज़ॉल्यूशन की छवियां शामिल हैं, जो तंत्रिका संपीड़न तकनीकों के लिए भी महत्वपूर्ण है।
चेहरे की पहचान में चुनौती कम-रिज़ॉल्यूशन छवियों से निकाले गए सबसे कम संभव विशेषताओं के साथ सटीकता को अधिकतम करना है। यह न केवल कम रिज़ॉल्यूशन पर चेहरों की पहचान करने के लिए उपयोगी है, बल्कि प्रशिक्षण मॉडल के अव्यक्त स्थान में छवि आकार की सीमाओं के कारण भी आवश्यक है।
कंप्यूटर विजन में, 'विशेषताएं' किसी भी छवि से विशिष्ट विशेषताओं को संदर्भित करती हैं, न कि केवल चेहरे। अपस्कलिंग एल्गोरिदम में उन्नति के साथ, विभिन्न तरीकों को कम-रिज़ॉल्यूशन निगरानी फुटेज को बढ़ाने के लिए प्रस्तावित किया गया है, संभवतः इसे अपराध दृश्य जांच जैसे कानूनी उद्देश्यों के लिए उपयोग करने योग्य बना दिया गया है।
हालांकि, गलत पहचान का जोखिम है, और आदर्श रूप से, चेहरे की पहचान प्रणालियों को सटीक पहचान करने के लिए उच्च-रिज़ॉल्यूशन छवियों की आवश्यकता नहीं होनी चाहिए। इस तरह के परिवर्तन महंगे हैं और उनकी वैधता और वैधता के बारे में सवाल उठाते हैं।
अधिक 'डाउन-एट-हील' सेलिब्रिटीज की आवश्यकता है
यह अधिक फायदेमंद होगा यदि चेहरे की पहचान प्रणाली छवियों को बदलने की आवश्यकता के बिना लिगेसी सिस्टम के आउटपुट से सीधे सुविधाएँ निकाल सकती है। इसके लिए उच्च-रिज़ॉल्यूशन पहचान और मौजूदा निगरानी प्रणालियों से अपमानित छवियों के बीच संबंधों की बेहतर समझ की आवश्यकता है।
समस्या मानकों में निहित है: MS-CELEB-1M और WebFace260M जैसे डेटासेट का व्यापक रूप से उपयोग किया जाता है क्योंकि वे लगातार बेंचमार्क प्रदान करते हैं। हालांकि, लेखकों का तर्क है कि इन डेटासेट पर प्रशिक्षित चेहरे की पहचान एल्गोरिदम पुराने निगरानी प्रणालियों के दृश्य डोमेन के लिए उपयुक्त नहीं हैं।
* Microsoft के लोकप्रिय MS-CELEB1M डेटासेट के उदाहरण।
पेपर में कहा गया है कि डोमेन शिफ्ट मुद्दों के कारण वास्तविक दुनिया की निगरानी कल्पना के साथ अत्याधुनिक चेहरे की पहचान मॉडल संघर्ष करते हैं। इन मॉडलों को अर्ध-विवश डेटासेट पर प्रशिक्षित किया जाता है, जिसमें वास्तविक दुनिया के परिदृश्यों में पाए जाने वाले बदलावों की कमी होती है, जैसे कि सेंसर शोर और मोशन ब्लर।
पिछले तरीकों ने ऐतिहासिक या कम लागत वाली निगरानी प्रणालियों के आउटपुट से मेल खाने की कोशिश की है, लेकिन ये 'अंधे' संवर्द्धन थे। इसके विपरीत, CFSM प्रशिक्षण के दौरान लक्ष्य प्रणाली से प्रत्यक्ष प्रतिक्रिया का उपयोग करता है और स्टाइल ट्रांसफर के माध्यम से उस डोमेन की नकल करता है।
*अभिनेत्री नताली पोर्टमैन, कंप्यूटर विज़न समुदाय पर हावी होने वाले मुट्ठी भर डेटासेट के लिए कोई अजनबी नहीं है, सीएफएसएम प्रदर्शन करने वाले इस उदाहरण में पहचान के बीच की विशेषताएं वास्तविक लक्ष्य मॉडल के डोमेन से प्रतिक्रिया के आधार पर शैली-मिलान किए गए डोमेन अनुकूलन।*
लेखकों की वास्तुकला लक्ष्य प्रणाली के आउटपुट से शैलियों और विशेषताओं को आयात करने के लिए फास्ट ग्रेडिएंट साइन विधि (FGSM) का उपयोग करती है। जैसे -जैसे प्रशिक्षण आगे बढ़ता है, पाइपलाइन की छवि पीढ़ी का हिस्सा लक्ष्य प्रणाली के लिए अधिक वफादार हो जाता है, जिससे चेहरे की पहचान के प्रदर्शन और सामान्यीकरण क्षमताओं में सुधार होता है।
परीक्षण और परिणाम
शोधकर्ताओं ने एमएसयू के पूर्व कार्य को एक टेम्पलेट के रूप में उपयोग करते हुए सीएफएसएम का परीक्षण किया, जो एमएस-सीलबीबी -1 एम और एमएस 1 एम-वी 2 को प्रशिक्षण डेटासेट के रूप में नियुक्त करता है। टारगेट डेटा हांगकांग के चीनी विश्वविद्यालय से वाइडफेस डेटासेट था, जिसे चुनौतीपूर्ण स्थितियों में चेहरे का पता लगाने के लिए डिज़ाइन किया गया था।
सिस्टम का मूल्यांकन चार फेस रिकग्निशन बेंचमार्क के खिलाफ किया गया था: IJB-B, IJB-C, IJB-S, और Tinyface। CFSM को 1E-4 की सीखने की दर के साथ ADAM ऑप्टिमाइज़र का उपयोग करके 32 के बैच आकार में 125,000 पुनरावृत्तियों के लिए, लगभग 0.4 मिलियन छवियों के लगभग 10% MS-CELEB-1M डेटा के साथ प्रशिक्षित किया गया था।
लक्ष्य चेहरे की पहचान मॉडल ने आर्कफेस लॉस फ़ंक्शन के साथ एक संशोधित RESNET-50 का उपयोग किया। एक अतिरिक्त मॉडल को CFSM के साथ तुलना के लिए प्रशिक्षित किया गया था, जिसे परिणामों में 'आर्कफेस' के रूप में लेबल किया गया था।
*CFSM के लिए प्राथमिक परीक्षणों से परिणाम। उच्च संख्या बेहतर हैं।*
परिणामों से पता चला कि CFSM द्वारा बढ़ाया गया ARCFACE मॉडल, चेहरे की पहचान और सत्यापन कार्यों दोनों में सभी आधारों को बेहतर बनाता है, नए अत्याधुनिक प्रदर्शन को प्राप्त करता है।
विरासत निगरानी प्रणालियों की विभिन्न विशेषताओं से डोमेन निकालने की क्षमता भी इन प्रणालियों के बीच वितरण समानता की तुलना और मूल्यांकन करने की अनुमति देती है, प्रत्येक को एक दृश्य शैली के संदर्भ में प्रस्तुत करती है जिसे भविष्य के काम में लीवरेज किया जा सकता है।
*विभिन्न डेटासेट के उदाहरण शैली में स्पष्ट अंतर प्रदर्शित करते हैं।*
लेखकों ने यह भी उल्लेख किया कि सीएफएसएम यह दर्शाता है कि दृष्टि कार्यों में मान्यता सटीकता को बढ़ाने के लिए कैसे प्रतिकूल हेरफेर का उपयोग किया जा सकता है। उन्होंने सीखा शैली के ठिकानों के आधार पर एक डेटासेट समानता मीट्रिक पेश किया, एक लेबल या भविष्यवक्ता-अज्ञेयिक तरीके से शैली के अंतर को कैप्चर किया।
अनुसंधान अप्रतिबंधित चेहरे की पहचान के लिए नियंत्रणीय और निर्देशित चेहरे संश्लेषण मॉडल की क्षमता को रेखांकित करता है और डेटासेट अंतर में अंतर्दृष्टि प्रदान करता है।
संबंधित लेख
लागत पर वृद्धि न करते हुए एआर के लिए वास्तविक फोकसिंग सिस्टम
प्रक्षेपण-आधारित वृद्धि-वाला आर-आरप्रसिद्ध इंस्टीट्यूट ऑफ़ इलेक्ट्रिकल एंड इलेक्ट्रॉनिक्स इंजीनियर्स (IEEE) के शोधकर्ताओं ने प्रक्षेपण-आधारित आर-आर के दुनिया में एक ब्रेकथ्रू पर का
कैसे हम एआई का उपयोग करते हैं ताकि शहरों को चरम गर्मी से निपटने में मदद मिल सके
यह 2024 की तरह लग रहा है, अभी तक सबसे गर्म वर्ष के लिए रिकॉर्ड तोड़ सकता है, 2023 को पार कर रहा है। यह प्रवृत्ति शहरी गर्मी द्वीपों में रहने वाले लोगों पर विशेष रूप से कठिन है - उन शहरों में वे धब्बे हैं जहां ठोस और डामर सूरज की किरणों को भिगोते हैं और फिर गर्मी को ठीक से बाहर निकालते हैं। ये क्षेत्र गर्म हो सकते हैं
दीपसेक की एआईएस सच्ची मानव इच्छाओं को उजागर करती है
एआई इनाम मॉडल में दीपसेक की सफलता: एआई रीजनिंग और रिस्पांस को बढ़ाते हुए चीनी एआई स्टार्टअप दीपसेक, त्सिंघुआ विश्वविद्यालय के सहयोग से, एआई अनुसंधान में एक महत्वपूर्ण मील का पत्थर हासिल किया है। एआई इनाम मॉडल के लिए उनका अभिनव दृष्टिकोण एआई सिस्टम कैसे सीखता है, क्रांति लाने का वादा करता है
सूचना (10)
0/200
LarryWilliams
25 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓
0
FrankJackson
26 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏
0
MatthewGonzalez
27 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍
0
CharlesJohnson
27 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌
0
HarryMartínez
26 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍
0
LawrencePerez
26 अप्रैल 2025 12:00:00 पूर्वाह्न GMT
This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨
0
मिशिगन स्टेट यूनिवर्सिटी के शोधकर्ता एक महान कारण के लिए सिंथेटिक चेहरों का उपयोग करने के लिए एक अभिनव तरीके से आए हैं - छवि मान्यता प्रणालियों की सटीकता को बढ़ाते हुए। दीपफेक घटना में योगदान देने के बजाय, इन सिंथेटिक चेहरों को वास्तविक दुनिया के वीडियो निगरानी फुटेज में पाए जाने वाले खामियों की नकल करने के लिए डिज़ाइन किया गया है।
टीम ने एक नियंत्रणीय फेस सिंथेसिस मॉड्यूल (सीएफएसएम) विकसित किया है जो एक शैली में चेहरे को पुन: उत्पन्न कर सकता है जो सीसीटीवी सिस्टम की विशिष्ट खामियों को दर्शाता है, जैसे कि चेहरे का धब्बा, कम रिज़ॉल्यूशन और सेंसर शोर। यह दृष्टिकोण लोकप्रिय डेटासेट से उच्च-गुणवत्ता वाली सेलिब्रिटी छवियों का उपयोग करने से अलग है, जो चेहरे की पहचान प्रणालियों द्वारा सामना की जाने वाली वास्तविक दुनिया की चुनौतियों पर कब्जा नहीं करते हैं।
* नियंत्रणीय फेस सिंथेसिस मॉड्यूल (CFSM) के लिए वैचारिक वास्तुकला।
डीपफेक सिस्टम के विपरीत, जो हेड पोज़ और एक्सप्रेशन की नकल करने पर ध्यान केंद्रित करते हैं, सीएफएसएम का उद्देश्य वैकल्पिक विचारों को उत्पन्न करना है जो स्टाइल ट्रांसफर के माध्यम से लक्ष्य मान्यता प्रणाली की शैली से मेल खाते हैं। यह मॉड्यूल विशेष रूप से विरासत प्रणालियों को अपनाने के लिए उपयोगी है जो लागत की कमी के कारण अपग्रेड होने की संभावना नहीं है, लेकिन फिर भी आधुनिक चेहरे की पहचान प्रौद्योगिकियों में योगदान करने की आवश्यकता है।
CFSM का परीक्षण करते समय, शोधकर्ताओं ने कम गुणवत्ता वाले डेटा से निपटने वाली छवि मान्यता प्रणालियों में महत्वपूर्ण सुधार देखे। उन्होंने एक अप्रत्याशित लाभ की भी खोज की: लक्ष्य डेटासेट को चिह्नित करने और तुलना करने की क्षमता, जो बेंचमार्किंग की प्रक्रिया को सरल बनाती है और विभिन्न सीसीटीवी सिस्टम के लिए सिलवाया डेटासेट बनाती है।
* लक्ष्य प्रणालियों की सीमाओं के अनुकूल होने के लिए चेहरे की पहचान मॉडल को प्रशिक्षित करना।
विधि को मौजूदा डेटासेट पर भी लागू किया जा सकता है, प्रभावी रूप से उन्हें चेहरे की पहचान के लिए अधिक उपयुक्त बनाने के लिए डोमेन अनुकूलन का प्रदर्शन किया जा सकता है। अप्रतिबंधित चेहरे की मान्यता के लिए ** नियंत्रणीय और निर्देशित फेस सिंथेसिस नामक शोध, आंशिक रूप से नेशनल इंटेलिजेंस के निदेशक (IARPA में ODNI) के अमेरिकी कार्यालय द्वारा आंशिक रूप से समर्थित है और इसमें MSU के कंप्यूटर विज्ञान और इंजीनियरिंग विभाग के चार शोधकर्ता शामिल हैं।
कम गुणवत्ता वाला चेहरा मान्यता: एक बढ़ता हुआ क्षेत्र
पिछले कुछ वर्षों में, कम गुणवत्ता वाले चेहरे की पहचान (LQFR) अध्ययन के एक महत्वपूर्ण क्षेत्र के रूप में उभरा है। टिकाऊ और लंबे समय तक चलने वाले कई पुराने वीडियो निगरानी प्रणाली, तकनीकी ऋण के कारण मशीन लर्निंग के लिए प्रभावी डेटा स्रोतों के रूप में सेवा करने के लिए पुरानी और संघर्ष हो गई हैं।
ऐतिहासिक और अधिक हाल के वीडियो निगरानी प्रणालियों की एक श्रृंखला में चेहरे के संकल्प के अलग -अलग स्तर। स्रोत: https://arxiv.org/pdf/1805.11519.pdf
एफ सौभाग्य से, प्रसार मॉडल और अन्य शोर-आधारित मॉडल इस मुद्दे को हल करने के लिए अच्छी तरह से अनुकूल हैं। नवीनतम छवि संश्लेषण प्रणालियों में से कई में उनकी प्रक्रिया के हिस्से के रूप में कम-रिज़ॉल्यूशन की छवियां शामिल हैं, जो तंत्रिका संपीड़न तकनीकों के लिए भी महत्वपूर्ण है।
चेहरे की पहचान में चुनौती कम-रिज़ॉल्यूशन छवियों से निकाले गए सबसे कम संभव विशेषताओं के साथ सटीकता को अधिकतम करना है। यह न केवल कम रिज़ॉल्यूशन पर चेहरों की पहचान करने के लिए उपयोगी है, बल्कि प्रशिक्षण मॉडल के अव्यक्त स्थान में छवि आकार की सीमाओं के कारण भी आवश्यक है।
कंप्यूटर विजन में, 'विशेषताएं' किसी भी छवि से विशिष्ट विशेषताओं को संदर्भित करती हैं, न कि केवल चेहरे। अपस्कलिंग एल्गोरिदम में उन्नति के साथ, विभिन्न तरीकों को कम-रिज़ॉल्यूशन निगरानी फुटेज को बढ़ाने के लिए प्रस्तावित किया गया है, संभवतः इसे अपराध दृश्य जांच जैसे कानूनी उद्देश्यों के लिए उपयोग करने योग्य बना दिया गया है।
हालांकि, गलत पहचान का जोखिम है, और आदर्श रूप से, चेहरे की पहचान प्रणालियों को सटीक पहचान करने के लिए उच्च-रिज़ॉल्यूशन छवियों की आवश्यकता नहीं होनी चाहिए। इस तरह के परिवर्तन महंगे हैं और उनकी वैधता और वैधता के बारे में सवाल उठाते हैं।
अधिक 'डाउन-एट-हील' सेलिब्रिटीज की आवश्यकता है
यह अधिक फायदेमंद होगा यदि चेहरे की पहचान प्रणाली छवियों को बदलने की आवश्यकता के बिना लिगेसी सिस्टम के आउटपुट से सीधे सुविधाएँ निकाल सकती है। इसके लिए उच्च-रिज़ॉल्यूशन पहचान और मौजूदा निगरानी प्रणालियों से अपमानित छवियों के बीच संबंधों की बेहतर समझ की आवश्यकता है।
समस्या मानकों में निहित है: MS-CELEB-1M और WebFace260M जैसे डेटासेट का व्यापक रूप से उपयोग किया जाता है क्योंकि वे लगातार बेंचमार्क प्रदान करते हैं। हालांकि, लेखकों का तर्क है कि इन डेटासेट पर प्रशिक्षित चेहरे की पहचान एल्गोरिदम पुराने निगरानी प्रणालियों के दृश्य डोमेन के लिए उपयुक्त नहीं हैं।
* Microsoft के लोकप्रिय MS-CELEB1M डेटासेट के उदाहरण।
पेपर में कहा गया है कि डोमेन शिफ्ट मुद्दों के कारण वास्तविक दुनिया की निगरानी कल्पना के साथ अत्याधुनिक चेहरे की पहचान मॉडल संघर्ष करते हैं। इन मॉडलों को अर्ध-विवश डेटासेट पर प्रशिक्षित किया जाता है, जिसमें वास्तविक दुनिया के परिदृश्यों में पाए जाने वाले बदलावों की कमी होती है, जैसे कि सेंसर शोर और मोशन ब्लर।
पिछले तरीकों ने ऐतिहासिक या कम लागत वाली निगरानी प्रणालियों के आउटपुट से मेल खाने की कोशिश की है, लेकिन ये 'अंधे' संवर्द्धन थे। इसके विपरीत, CFSM प्रशिक्षण के दौरान लक्ष्य प्रणाली से प्रत्यक्ष प्रतिक्रिया का उपयोग करता है और स्टाइल ट्रांसफर के माध्यम से उस डोमेन की नकल करता है।
*अभिनेत्री नताली पोर्टमैन, कंप्यूटर विज़न समुदाय पर हावी होने वाले मुट्ठी भर डेटासेट के लिए कोई अजनबी नहीं है, सीएफएसएम प्रदर्शन करने वाले इस उदाहरण में पहचान के बीच की विशेषताएं वास्तविक लक्ष्य मॉडल के डोमेन से प्रतिक्रिया के आधार पर शैली-मिलान किए गए डोमेन अनुकूलन।*
लेखकों की वास्तुकला लक्ष्य प्रणाली के आउटपुट से शैलियों और विशेषताओं को आयात करने के लिए फास्ट ग्रेडिएंट साइन विधि (FGSM) का उपयोग करती है। जैसे -जैसे प्रशिक्षण आगे बढ़ता है, पाइपलाइन की छवि पीढ़ी का हिस्सा लक्ष्य प्रणाली के लिए अधिक वफादार हो जाता है, जिससे चेहरे की पहचान के प्रदर्शन और सामान्यीकरण क्षमताओं में सुधार होता है।
परीक्षण और परिणाम
शोधकर्ताओं ने एमएसयू के पूर्व कार्य को एक टेम्पलेट के रूप में उपयोग करते हुए सीएफएसएम का परीक्षण किया, जो एमएस-सीलबीबी -1 एम और एमएस 1 एम-वी 2 को प्रशिक्षण डेटासेट के रूप में नियुक्त करता है। टारगेट डेटा हांगकांग के चीनी विश्वविद्यालय से वाइडफेस डेटासेट था, जिसे चुनौतीपूर्ण स्थितियों में चेहरे का पता लगाने के लिए डिज़ाइन किया गया था।
सिस्टम का मूल्यांकन चार फेस रिकग्निशन बेंचमार्क के खिलाफ किया गया था: IJB-B, IJB-C, IJB-S, और Tinyface। CFSM को 1E-4 की सीखने की दर के साथ ADAM ऑप्टिमाइज़र का उपयोग करके 32 के बैच आकार में 125,000 पुनरावृत्तियों के लिए, लगभग 0.4 मिलियन छवियों के लगभग 10% MS-CELEB-1M डेटा के साथ प्रशिक्षित किया गया था।
लक्ष्य चेहरे की पहचान मॉडल ने आर्कफेस लॉस फ़ंक्शन के साथ एक संशोधित RESNET-50 का उपयोग किया। एक अतिरिक्त मॉडल को CFSM के साथ तुलना के लिए प्रशिक्षित किया गया था, जिसे परिणामों में 'आर्कफेस' के रूप में लेबल किया गया था।
*CFSM के लिए प्राथमिक परीक्षणों से परिणाम। उच्च संख्या बेहतर हैं।*
परिणामों से पता चला कि CFSM द्वारा बढ़ाया गया ARCFACE मॉडल, चेहरे की पहचान और सत्यापन कार्यों दोनों में सभी आधारों को बेहतर बनाता है, नए अत्याधुनिक प्रदर्शन को प्राप्त करता है।
विरासत निगरानी प्रणालियों की विभिन्न विशेषताओं से डोमेन निकालने की क्षमता भी इन प्रणालियों के बीच वितरण समानता की तुलना और मूल्यांकन करने की अनुमति देती है, प्रत्येक को एक दृश्य शैली के संदर्भ में प्रस्तुत करती है जिसे भविष्य के काम में लीवरेज किया जा सकता है।
*विभिन्न डेटासेट के उदाहरण शैली में स्पष्ट अंतर प्रदर्शित करते हैं।*
लेखकों ने यह भी उल्लेख किया कि सीएफएसएम यह दर्शाता है कि दृष्टि कार्यों में मान्यता सटीकता को बढ़ाने के लिए कैसे प्रतिकूल हेरफेर का उपयोग किया जा सकता है। उन्होंने सीखा शैली के ठिकानों के आधार पर एक डेटासेट समानता मीट्रिक पेश किया, एक लेबल या भविष्यवक्ता-अज्ञेयिक तरीके से शैली के अंतर को कैप्चर किया।
अनुसंधान अप्रतिबंधित चेहरे की पहचान के लिए नियंत्रणीय और निर्देशित चेहरे संश्लेषण मॉडल की क्षमता को रेखांकित करता है और डेटासेट अंतर में अंतर्दृष्टि प्रदान करता है।



This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓




合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏




Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍




¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌




Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍




This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨












