विकल्प
घर
समाचार
'अपमानित' सिंथेटिक चेहरे चेहरे की पहचान तकनीक को बढ़ा सकते हैं

'अपमानित' सिंथेटिक चेहरे चेहरे की पहचान तकनीक को बढ़ा सकते हैं

25 अप्रैल 2025
77

मिशिगन स्टेट यूनिवर्सिटी के शोधकर्ता एक महान कारण के लिए सिंथेटिक चेहरों का उपयोग करने के लिए एक अभिनव तरीके से आए हैं - छवि मान्यता प्रणालियों की सटीकता को बढ़ाते हुए। दीपफेक घटना में योगदान देने के बजाय, इन सिंथेटिक चेहरों को वास्तविक दुनिया के वीडियो निगरानी फुटेज में पाए जाने वाले खामियों की नकल करने के लिए डिज़ाइन किया गया है।

टीम ने एक नियंत्रणीय फेस सिंथेसिस मॉड्यूल (सीएफएसएम) विकसित किया है जो एक शैली में चेहरे को पुन: उत्पन्न कर सकता है जो सीसीटीवी सिस्टम की विशिष्ट खामियों को दर्शाता है, जैसे कि चेहरे का धब्बा, कम रिज़ॉल्यूशन और सेंसर शोर। यह दृष्टिकोण लोकप्रिय डेटासेट से उच्च-गुणवत्ता वाली सेलिब्रिटी छवियों का उपयोग करने से अलग है, जो चेहरे की पहचान प्रणालियों द्वारा सामना की जाने वाली वास्तविक दुनिया की चुनौतियों पर कब्जा नहीं करते हैं।

नियंत्रणीय चेहरे संश्लेषण मॉड्यूल (CFSM) के लिए वैचारिक वास्तुकला। स्रोत: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022.pdf * नियंत्रणीय फेस सिंथेसिस मॉड्यूल (CFSM) के लिए वैचारिक वास्तुकला।

डीपफेक सिस्टम के विपरीत, जो हेड पोज़ और एक्सप्रेशन की नकल करने पर ध्यान केंद्रित करते हैं, सीएफएसएम का उद्देश्य वैकल्पिक विचारों को उत्पन्न करना है जो स्टाइल ट्रांसफर के माध्यम से लक्ष्य मान्यता प्रणाली की शैली से मेल खाते हैं। यह मॉड्यूल विशेष रूप से विरासत प्रणालियों को अपनाने के लिए उपयोगी है जो लागत की कमी के कारण अपग्रेड होने की संभावना नहीं है, लेकिन फिर भी आधुनिक चेहरे की पहचान प्रौद्योगिकियों में योगदान करने की आवश्यकता है।

CFSM का परीक्षण करते समय, शोधकर्ताओं ने कम गुणवत्ता वाले डेटा से निपटने वाली छवि मान्यता प्रणालियों में महत्वपूर्ण सुधार देखे। उन्होंने एक अप्रत्याशित लाभ की भी खोज की: लक्ष्य डेटासेट को चिह्नित करने और तुलना करने की क्षमता, जो बेंचमार्किंग की प्रक्रिया को सरल बनाती है और विभिन्न सीसीटीवी सिस्टम के लिए सिलवाया डेटासेट बनाती है।

लक्ष्य प्रणालियों की सीमाओं के अनुकूल होने के लिए चेहरे की पहचान मॉडल का प्रशिक्षण। स्रोत: http://cvlab.cse.msu.edu/pdfs/liu_kim_jain_liu_eccv2022_supp.pdf * लक्ष्य प्रणालियों की सीमाओं के अनुकूल होने के लिए चेहरे की पहचान मॉडल को प्रशिक्षित करना।

विधि को मौजूदा डेटासेट पर भी लागू किया जा सकता है, प्रभावी रूप से उन्हें चेहरे की पहचान के लिए अधिक उपयुक्त बनाने के लिए डोमेन अनुकूलन का प्रदर्शन किया जा सकता है। अप्रतिबंधित चेहरे की मान्यता के लिए ** नियंत्रणीय और निर्देशित फेस सिंथेसिस नामक शोध, आंशिक रूप से नेशनल इंटेलिजेंस के निदेशक (IARPA में ODNI) के अमेरिकी कार्यालय द्वारा आंशिक रूप से समर्थित है और इसमें MSU के कंप्यूटर विज्ञान और इंजीनियरिंग विभाग के चार शोधकर्ता शामिल हैं।

कम गुणवत्ता वाला चेहरा मान्यता: एक बढ़ता हुआ क्षेत्र

पिछले कुछ वर्षों में, कम गुणवत्ता वाले चेहरे की पहचान (LQFR) अध्ययन के एक महत्वपूर्ण क्षेत्र के रूप में उभरा है। टिकाऊ और लंबे समय तक चलने वाले कई पुराने वीडियो निगरानी प्रणाली, तकनीकी ऋण के कारण मशीन लर्निंग के लिए प्रभावी डेटा स्रोतों के रूप में सेवा करने के लिए पुरानी और संघर्ष हो गई हैं।

ऐतिहासिक और अधिक हाल के वीडियो निगरानी प्रणालियों की एक श्रृंखला में चेहरे के संकल्प के अलग -अलग स्तर। स्रोत: https://arxiv.org/pdf/1805.11519.pdf ऐतिहासिक और अधिक हाल के वीडियो निगरानी प्रणालियों की एक श्रृंखला में चेहरे के संकल्प के अलग -अलग स्तर। स्रोत: https://arxiv.org/pdf/1805.11519.pdf

एफ सौभाग्य से, प्रसार मॉडल और अन्य शोर-आधारित मॉडल इस मुद्दे को हल करने के लिए अच्छी तरह से अनुकूल हैं। नवीनतम छवि संश्लेषण प्रणालियों में से कई में उनकी प्रक्रिया के हिस्से के रूप में कम-रिज़ॉल्यूशन की छवियां शामिल हैं, जो तंत्रिका संपीड़न तकनीकों के लिए भी महत्वपूर्ण है।

चेहरे की पहचान में चुनौती कम-रिज़ॉल्यूशन छवियों से निकाले गए सबसे कम संभव विशेषताओं के साथ सटीकता को अधिकतम करना है। यह न केवल कम रिज़ॉल्यूशन पर चेहरों की पहचान करने के लिए उपयोगी है, बल्कि प्रशिक्षण मॉडल के अव्यक्त स्थान में छवि आकार की सीमाओं के कारण भी आवश्यक है।

कंप्यूटर विजन में, 'विशेषताएं' किसी भी छवि से विशिष्ट विशेषताओं को संदर्भित करती हैं, न कि केवल चेहरे। अपस्कलिंग एल्गोरिदम में उन्नति के साथ, विभिन्न तरीकों को कम-रिज़ॉल्यूशन निगरानी फुटेज को बढ़ाने के लिए प्रस्तावित किया गया है, संभवतः इसे अपराध दृश्य जांच जैसे कानूनी उद्देश्यों के लिए उपयोग करने योग्य बना दिया गया है।

हालांकि, गलत पहचान का जोखिम है, और आदर्श रूप से, चेहरे की पहचान प्रणालियों को सटीक पहचान करने के लिए उच्च-रिज़ॉल्यूशन छवियों की आवश्यकता नहीं होनी चाहिए। इस तरह के परिवर्तन महंगे हैं और उनकी वैधता और वैधता के बारे में सवाल उठाते हैं।

अधिक 'डाउन-एट-हील' सेलिब्रिटीज की आवश्यकता है

यह अधिक फायदेमंद होगा यदि चेहरे की पहचान प्रणाली छवियों को बदलने की आवश्यकता के बिना लिगेसी सिस्टम के आउटपुट से सीधे सुविधाएँ निकाल सकती है। इसके लिए उच्च-रिज़ॉल्यूशन पहचान और मौजूदा निगरानी प्रणालियों से अपमानित छवियों के बीच संबंधों की बेहतर समझ की आवश्यकता है।

समस्या मानकों में निहित है: MS-CELEB-1M और WebFace260M जैसे डेटासेट का व्यापक रूप से उपयोग किया जाता है क्योंकि वे लगातार बेंचमार्क प्रदान करते हैं। हालांकि, लेखकों का तर्क है कि इन डेटासेट पर प्रशिक्षित चेहरे की पहचान एल्गोरिदम पुराने निगरानी प्रणालियों के दृश्य डोमेन के लिए उपयुक्त नहीं हैं।

Microsoft के लोकप्रिय MS-CELEB1M डेटासेट से उदाहरण। स्रोत: https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/ * Microsoft के लोकप्रिय MS-CELEB1M डेटासेट के उदाहरण।

पेपर में कहा गया है कि डोमेन शिफ्ट मुद्दों के कारण वास्तविक दुनिया की निगरानी कल्पना के साथ अत्याधुनिक चेहरे की पहचान मॉडल संघर्ष करते हैं। इन मॉडलों को अर्ध-विवश डेटासेट पर प्रशिक्षित किया जाता है, जिसमें वास्तविक दुनिया के परिदृश्यों में पाए जाने वाले बदलावों की कमी होती है, जैसे कि सेंसर शोर और मोशन ब्लर।

पिछले तरीकों ने ऐतिहासिक या कम लागत वाली निगरानी प्रणालियों के आउटपुट से मेल खाने की कोशिश की है, लेकिन ये 'अंधे' संवर्द्धन थे। इसके विपरीत, CFSM प्रशिक्षण के दौरान लक्ष्य प्रणाली से प्रत्यक्ष प्रतिक्रिया का उपयोग करता है और स्टाइल ट्रांसफर के माध्यम से उस डोमेन की नकल करता है।

अभिनेत्री नताली पोर्टमैन, कंप्यूटर विज़न समुदाय पर हावी होने वाले मुट्ठी भर डेटासेट के लिए कोई अजनबी नहीं है, जो वास्तविक लक्ष्य मॉडल के डोमेन से प्रतिक्रिया के आधार पर सीएफएसएम प्रदर्शन शैली-मिलान डोमेन अनुकूलन के इस उदाहरण में पहचान के बीच है। *अभिनेत्री नताली पोर्टमैन, कंप्यूटर विज़न समुदाय पर हावी होने वाले मुट्ठी भर डेटासेट के लिए कोई अजनबी नहीं है, सीएफएसएम प्रदर्शन करने वाले इस उदाहरण में पहचान के बीच की विशेषताएं वास्तविक लक्ष्य मॉडल के डोमेन से प्रतिक्रिया के आधार पर शैली-मिलान किए गए डोमेन अनुकूलन।*

लेखकों की वास्तुकला लक्ष्य प्रणाली के आउटपुट से शैलियों और विशेषताओं को आयात करने के लिए फास्ट ग्रेडिएंट साइन विधि (FGSM) का उपयोग करती है। जैसे -जैसे प्रशिक्षण आगे बढ़ता है, पाइपलाइन की छवि पीढ़ी का हिस्सा लक्ष्य प्रणाली के लिए अधिक वफादार हो जाता है, जिससे चेहरे की पहचान के प्रदर्शन और सामान्यीकरण क्षमताओं में सुधार होता है।

परीक्षण और परिणाम

शोधकर्ताओं ने एमएसयू के पूर्व कार्य को एक टेम्पलेट के रूप में उपयोग करते हुए सीएफएसएम का परीक्षण किया, जो एमएस-सीलबीबी -1 एम और एमएस 1 एम-वी 2 को प्रशिक्षण डेटासेट के रूप में नियुक्त करता है। टारगेट डेटा हांगकांग के चीनी विश्वविद्यालय से वाइडफेस डेटासेट था, जिसे चुनौतीपूर्ण स्थितियों में चेहरे का पता लगाने के लिए डिज़ाइन किया गया था।

सिस्टम का मूल्यांकन चार फेस रिकग्निशन बेंचमार्क के खिलाफ किया गया था: IJB-B, IJB-C, IJB-S, और Tinyface। CFSM को 1E-4 की सीखने की दर के साथ ADAM ऑप्टिमाइज़र का उपयोग करके 32 के बैच आकार में 125,000 पुनरावृत्तियों के लिए, लगभग 0.4 मिलियन छवियों के लगभग 10% MS-CELEB-1M डेटा के साथ प्रशिक्षित किया गया था।

लक्ष्य चेहरे की पहचान मॉडल ने आर्कफेस लॉस फ़ंक्शन के साथ एक संशोधित RESNET-50 का उपयोग किया। एक अतिरिक्त मॉडल को CFSM के साथ तुलना के लिए प्रशिक्षित किया गया था, जिसे परिणामों में 'आर्कफेस' के रूप में लेबल किया गया था।

CFSM के लिए प्राथमिक परीक्षणों से परिणाम। उच्च संख्या बेहतर हैं। *CFSM के लिए प्राथमिक परीक्षणों से परिणाम। उच्च संख्या बेहतर हैं।*

परिणामों से पता चला कि CFSM द्वारा बढ़ाया गया ARCFACE मॉडल, चेहरे की पहचान और सत्यापन कार्यों दोनों में सभी आधारों को बेहतर बनाता है, नए अत्याधुनिक प्रदर्शन को प्राप्त करता है।

विरासत निगरानी प्रणालियों की विभिन्न विशेषताओं से डोमेन निकालने की क्षमता भी इन प्रणालियों के बीच वितरण समानता की तुलना और मूल्यांकन करने की अनुमति देती है, प्रत्येक को एक दृश्य शैली के संदर्भ में प्रस्तुत करती है जिसे भविष्य के काम में लीवरेज किया जा सकता है।

विभिन्न डेटासेट के उदाहरण शैली में स्पष्ट अंतर प्रदर्शित करते हैं। *विभिन्न डेटासेट के उदाहरण शैली में स्पष्ट अंतर प्रदर्शित करते हैं।*

लेखकों ने यह भी उल्लेख किया कि सीएफएसएम यह दर्शाता है कि दृष्टि कार्यों में मान्यता सटीकता को बढ़ाने के लिए कैसे प्रतिकूल हेरफेर का उपयोग किया जा सकता है। उन्होंने सीखा शैली के ठिकानों के आधार पर एक डेटासेट समानता मीट्रिक पेश किया, एक लेबल या भविष्यवक्ता-अज्ञेयिक तरीके से शैली के अंतर को कैप्चर किया।

अनुसंधान अप्रतिबंधित चेहरे की पहचान के लिए नियंत्रणीय और निर्देशित चेहरे संश्लेषण मॉडल की क्षमता को रेखांकित करता है और डेटासेट अंतर में अंतर्दृष्टि प्रदान करता है।

संबंधित लेख
लागत पर वृद्धि न करते हुए एआर के लिए वास्तविक फोकसिंग सिस्टम लागत पर वृद्धि न करते हुए एआर के लिए वास्तविक फोकसिंग सिस्टम प्रक्षेपण-आधारित वृद्धि-वाला आर-आरप्रसिद्ध इंस्टीट्यूट ऑफ़ इलेक्ट्रिकल एंड इलेक्ट्रॉनिक्स इंजीनियर्स (IEEE) के शोधकर्ताओं ने प्रक्षेपण-आधारित आर-आर के दुनिया में एक ब्रेकथ्रू पर का
कैसे हम एआई का उपयोग करते हैं ताकि शहरों को चरम गर्मी से निपटने में मदद मिल सके कैसे हम एआई का उपयोग करते हैं ताकि शहरों को चरम गर्मी से निपटने में मदद मिल सके यह 2024 की तरह लग रहा है, अभी तक सबसे गर्म वर्ष के लिए रिकॉर्ड तोड़ सकता है, 2023 को पार कर रहा है। यह प्रवृत्ति शहरी गर्मी द्वीपों में रहने वाले लोगों पर विशेष रूप से कठिन है - उन शहरों में वे धब्बे हैं जहां ठोस और डामर सूरज की किरणों को भिगोते हैं और फिर गर्मी को ठीक से बाहर निकालते हैं। ये क्षेत्र गर्म हो सकते हैं
दीपसेक की एआईएस सच्ची मानव इच्छाओं को उजागर करती है दीपसेक की एआईएस सच्ची मानव इच्छाओं को उजागर करती है एआई इनाम मॉडल में दीपसेक की सफलता: एआई रीजनिंग और रिस्पांस को बढ़ाते हुए चीनी एआई स्टार्टअप दीपसेक, त्सिंघुआ विश्वविद्यालय के सहयोग से, एआई अनुसंधान में एक महत्वपूर्ण मील का पत्थर हासिल किया है। एआई इनाम मॉडल के लिए उनका अभिनव दृष्टिकोण एआई सिस्टम कैसे सीखता है, क्रांति लाने का वादा करता है
सूचना (10)
LarryWilliams
LarryWilliams 25 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

This tool is pretty cool! Using synthetic faces to improve facial recognition? Genius! It's nice to see tech being used for good instead of deepfakes. Only wish it was a bit more user-friendly, but still, thumbs up for the innovation! 🤓

FrankJackson
FrankJackson 26 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

合成顔を使って顔認識技術を向上させるなんて、素晴らしいアイデアだと思う!深偽ではなく、良い目的に使われる技術は嬉しいね。ただ、もう少し使いやすければ完璧だったのに。でも、革新性には拍手を送りたい!👏

MatthewGonzalez
MatthewGonzalez 27 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

Que ideia genial usar faces sintéticas para melhorar o reconhecimento facial! Adoro que a tecnologia esteja sendo usada para o bem, e não para deepfakes. A única coisa é que poderia ser mais fácil de usar, mas ainda assim, inovação top! 👍

CharlesJohnson
CharlesJohnson 27 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

¡Qué genial usar caras sintéticas para mejorar el reconocimiento facial! Me encanta que la tecnología se use para algo bueno y no para deepfakes. Lo único es que podría ser más fácil de usar, pero de todos modos, ¡innovación de primera! 👌

HarryMartínez
HarryMartínez 26 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

Synthetische Gesichter zur Verbesserung der Gesichtserkennung zu nutzen, ist eine geniale Idee! Es ist schön zu sehen, dass Technologie für etwas Gutes genutzt wird und nicht für Deepfakes. Es wäre nur schön, wenn es benutzerfreundlicher wäre, aber trotzdem, tolle Innovation! 👍

LawrencePerez
LawrencePerez 26 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

This sounds super interesting! Using synthetic faces to improve facial recognition tech could be a big deal. It's cool they're focusing on real-world imperfections instead of making fake stuff. I wonder how effective it'll be in practical situations though. 🤔✨

शीर्ष समाचार
Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया दक्षिण कोरिया स्थानीय दुकानों में दीपसेक ऐप डाउनलोड करता है Adobe 10 विशिष्ट AI एजेंटों का अनावरण करता है: उनके व्यावसायिक अनुप्रयोगों की खोज करें चैट की ऊर्जा का उपयोग अपेक्षा से कम है Openai का O3 मॉडल संभावित रूप से अधिक महंगा है जो शुरू में विचार की तुलना में संचालित होता है नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है
अधिक
शीर्ष पर वापस
OR