विकल्प
घर समाचार मेटा स्टाफ ने एआई प्रशिक्षण के लिए कॉपीराइट की गई सामग्री का उपयोग करके चर्चा की, कोर्ट फाइलिंग से पता चलता है

मेटा स्टाफ ने एआई प्रशिक्षण के लिए कॉपीराइट की गई सामग्री का उपयोग करके चर्चा की, कोर्ट फाइलिंग से पता चलता है

रिलीज़ की तारीख रिलीज़ की तारीख 10 अप्रैल 2025
लेखक लेखक JosephEvans
दृश्य दृश्य 16

मेटा स्टाफ ने एआई प्रशिक्षण के लिए कॉपीराइट की गई सामग्री का उपयोग करके चर्चा की, कोर्ट फाइलिंग से पता चलता है

वर्षों से, मेटा के कर्मचारी गुरुवार को अनसुना कर दिए गए अदालती दस्तावेजों के अनुसार, कंपनी के एआई मॉडल को प्रशिक्षित करने के लिए, संभावित छायादार साधनों के माध्यम से प्राप्त कॉपीराइट सामग्री के उपयोग पर चर्चा कर रहे हैं।

ये दस्तावेज चल रहे मुकदमे काद्रे बनाम मेटा का हिस्सा थे, जो कई एआई कॉपीराइट विवादों में से एक है, जो अमेरिकी अदालत प्रणाली के माध्यम से अपना रास्ता बना रहा था। मेटा का तर्क है कि उनके मॉडल को प्रशिक्षित करने के लिए आईपी-संरक्षित कार्यों, विशेष रूप से पुस्तकों का उपयोग करना "उचित उपयोग" के अंतर्गत आता है। हालांकि, लेखक सारा सिल्वरमैन और टा-नेहिसी कोट्स सहित वादी दृढ़ता से असहमत हैं।

पहले मामले में फाइलिंग ने सुझाव दिया था कि मेटा के सीईओ मार्क जुकरबर्ग ने प्रशिक्षण के लिए कॉपीराइट सामग्री के उपयोग को मंजूरी दे दी थी और मेटा ने पुस्तक प्रकाशकों के साथ लाइसेंसिंग सौदों पर बातचीत करना बंद कर दिया था। नए अनसुलझे दस्तावेज, जिसमें मेटा कर्मचारियों के बीच आंतरिक कार्य चैट शामिल हैं, सबसे विस्तृत अंतर्दृष्टि प्रदान करते हैं कि मेटा ने अपने मॉडलों को प्रशिक्षित करने के लिए कॉपीराइट डेटा का उपयोग कैसे किया हो सकता है, जिसमें लामा परिवार भी शामिल है।

एक चैट में, मेटा के लामा मॉडल रिसर्च टीम के एक वरिष्ठ प्रबंधक मेलानी कंबादुर सहित मेटा के कर्मचारियों ने उन कार्यों पर प्रशिक्षण मॉडल के बारे में बात की, जिन्हें वे जानते थे कि वे कानूनी रूप से जोखिम भरा हो सकते हैं।

फाइलिंग के अनुसार, 2023 फरवरी की चैट में मेटा रिसर्च इंजीनियर, जेवियर मार्टिनेट ने लिखा, "मेरा टेक (माफी पूछें, अनुमति नहीं, अनुमति नहीं ') की भावना में है: हमें पुस्तकों को हड़पना चाहिए और निष्पादित करना चाहिए।" "यही कारण है कि उन्होंने इस जनरल एआई ऑर्ग को बनाया: इसलिए हम अधिक जोखिम उठा सकते हैं।"

मार्टिनेट ने प्रकाशकों के साथ लाइसेंसिंग सौदों पर बातचीत करने के बजाय एक प्रशिक्षण सेट बनाने के लिए खुदरा कीमतों पर ई-बुक खरीदने का सुझाव दिया। जब एक अन्य कर्मचारी ने अनधिकृत कॉपीराइट सामग्री का उपयोग करने के साथ संभावित कानूनी मुद्दों को इंगित किया, तो मार्टिनेट ने दोगुना हो गया, यह देखते हुए कि "एक गज़िलियन" स्टार्टअप पहले से ही प्रशिक्षण के लिए पायरेटेड पुस्तकों का उपयोग कर रहे थे।

"मेरा मतलब है, सबसे खराब मामला: हमें पता चलता है कि यह ठीक है, जबकि एक गजिलियन स्टार्टअप्स ने बिटटोरेंट पर सिर्फ किताबों के टन पायरेट किए हैं," मार्टिनेट ने फाइलिंग के अनुसार लिखा है। "मेरे दो सेंट फिर से: प्रकाशकों के साथ सीधे व्यवहार करना हमेशा के लिए लेता है ..."

एक ही चैट में, कांबाडुर, जिन्होंने उल्लेख किया कि मेटा लाइसेंस के लिए Scribd और अन्य प्लेटफार्मों के साथ बातचीत कर रहा था, ने कहा कि प्रशिक्षण के लिए "सार्वजनिक रूप से उपलब्ध डेटा" का उपयोग करने के दौरान अभी भी अनुमोदन की आवश्यकता होगी, मेटा के वकील इस तरह के अनुमोदन देने के बारे में "कम रूढ़िवादी" बन रहे थे।

"हाँ, हमें अभी भी सार्वजनिक रूप से उपलब्ध आंकड़ों के लिए लाइसेंस या अनुमोदन प्राप्त करने की आवश्यकता है," कंबादुर ने कहा, फाइलिंग के अनुसार। "अब अंतर यह है कि हमारे पास अधिक पैसा है, अधिक वकील, अधिक व्यवसाय विकास सहायता, तेजी से ट्रैक करने की क्षमता और गति के लिए आगे बढ़ें, और वकीलों को अनुमोदन के साथ थोड़ा कम सतर्क किया जा रहा है।"

Libgen की बातचीत

फाइलिंग में उल्लिखित एक अन्य कार्य चैट में, कांबाडुर ने लिबगेन, एक "लिंक एग्रीगेटर" का उपयोग करने की संभावना पर चर्चा की, जो लाइसेंस प्राप्त डेटा स्रोतों के विकल्प के रूप में प्रकाशकों से कॉपीराइट किए गए कार्यों तक पहुंच प्रदान करता है।

लिबगेन को कई मुकदमों का सामना करना पड़ा है, उन्हें बंद करने का आदेश दिया गया है, और कॉपीराइट उल्लंघन के लिए लाखों डॉलर का जुर्माना लगाया गया है। कम्बादुर के सहयोगियों में से एक ने लिबगेन के लिए Google खोज परिणाम के स्क्रीनशॉट के साथ जवाब दिया, जिसमें स्निपेट शामिल था "नहीं, लिबजेन कानूनी नहीं है।"

मेटा में कुछ निर्णय लेने वालों का मानना ​​था कि मॉडल प्रशिक्षण के लिए लिबगेन का उपयोग नहीं करना, एआई दौड़ में मेटा की प्रतिस्पर्धा को गंभीरता से प्रभावित कर सकता है, फाइलिंग के अनुसार।

मेटा एआई वीपी जोले पिनेउ को एक ईमेल में, मेटा में उत्पाद प्रबंधन के निदेशक सोनी थीकनाथ, ने लिबगेन कहा, "सभी श्रेणियों में SOTA नंबरों को पूरा करने के लिए आवश्यक," सबसे अच्छा, अत्याधुनिक (SOTA) AI मॉडल प्रदर्शन और बेंचमार्क श्रेणियों को प्राप्त करने का उल्लेख करते हुए।

मेटा के कानूनी जोखिम को कम करने के लिए ईमेल में "माइटिगेशन" को भी रेखांकित किया गया था, जैसे कि लिबगेन से डेटा को हटाना जो "स्पष्ट रूप से पायरेटेड/चोरी के रूप में चिह्नित था" और सार्वजनिक रूप से प्रशिक्षण के लिए लिबजेन डेटासेट के उपयोग का खुलासा नहीं किया। "हम प्रशिक्षित करने के लिए उपयोग किए जाने वाले लिबगेन डेटासेट के उपयोग का खुलासा नहीं करेंगे," थीकनाथ ने लिखा।

व्यवहार में, इन mitigations में फाइलिंग के अनुसार "चोरी" या "पायरेटेड" जैसे शब्दों के लिए libgen फ़ाइलों के माध्यम से खोज करना शामिल है।

एक वर्क चैट में, कांबाडुर ने उल्लेख किया कि मेटा की एआई टीम ने भी "आईपी रिस्की प्रॉम्प्ट से बचने के लिए मॉडल को समायोजित किया"-जिसका अर्थ है कि उन्होंने "हैरी पॉटर और सोर्सर स्टोन 'के पहले तीन पन्नों को पुन: पेश करने जैसे सवालों के जवाब देने से इनकार करने के लिए मॉडल को कॉन्फ़िगर किया या" मुझे बताएं कि आपको कौन सी ई-बुक्स पर प्रशिक्षित किया गया था। "

फाइलिंग यह भी बताती है कि मेटा ने कुछ प्रकार के मॉडल प्रशिक्षण के लिए Reddit डेटा को स्क्रैप किया हो सकता है, संभवतः पुशशिफ्ट नामक एक तृतीय-पक्ष ऐप के व्यवहार की नकल करके। विशेष रूप से, Reddit ने अप्रैल 2023 में घोषणा की कि उसने मॉडल प्रशिक्षण के लिए डेटा तक पहुंच के लिए AI कंपनियों को चार्ज करना शुरू करने की योजना बनाई है।

मार्च 2024 की एक चैट में, मेटा के जेनेरिक एआई ऑर्गन में उत्पाद प्रबंधन के निदेशक चाया नायक ने कहा कि मेटा नेतृत्व प्रशिक्षण सेटों पर पिछले निर्णयों पर "ओवरराइडिंग" पर विचार कर रहा था, जिसमें एक निर्णय शामिल था, जिसमें Quora सामग्री या लाइसेंस प्राप्त पुस्तकों और वैज्ञानिक लेखों का उपयोग नहीं किया गया था, ताकि यह सुनिश्चित हो सके कि कंपनी के मॉडल के पास पर्याप्त प्रशिक्षण डेटा था।

नायक ने कहा कि मेटा के प्रथम-पार्टी प्रशिक्षण डेटासेट-जैसे कि फेसबुक और इंस्टाग्राम पोस्ट, मेटा प्लेटफार्मों पर वीडियो से स्थानांतरित पाठ, और व्यावसायिक संदेशों के लिए कुछ मेटा-पर्याप्त नहीं थे। "हमें अधिक डेटा की आवश्यकता है," उसने लिखा।

काद्रे बनाम मेटा में वादी ने 2023 में कैलिफोर्निया के उत्तरी जिले, सैन फ्रांसिस्को डिवीजन के लिए अमेरिकी जिला अदालत में मामले को दर्ज करने के बाद से कई बार अपनी शिकायत में संशोधन किया है। नवीनतम संशोधन में यह आरोप लगाया गया है कि मेटा, अन्य दावों के साथ, कुछ पायरेटेड पुस्तकों की तुलना में यह तय करने के लिए कि लाइसेंस के लिए एक लाइसेंस के साथ उपलब्ध है, जो एक प्रकाशक के साथ उपलब्ध है।

मेटा कितनी गंभीरता से कानूनी दांव को देखती है, इस बात पर, कंपनी ने सर्वोच्च न्यायालय के दो मुकदमों को कानून फर्म पॉल वीस से मामले में अपनी रक्षा टीम में जोड़ा है।

मेटा ने टिप्पणी के लिए अनुरोध का तुरंत जवाब नहीं दिया।

संबंधित लेख
메타는 LLAMA 4 릴리스를 방어하고 혼합 품질 보고서의 원인으로 버그를 인용합니다. 메타는 LLAMA 4 릴리스를 방어하고 혼합 품질 보고서의 원인으로 버그를 인용합니다. 주말 동안, Facebook, Instagram, Whatsapp 및 Quest VR 뒤의 강국 인 Meta는 최신 AI 언어 모델 인 Llama 4를 공개하여 모든 사람들을 놀라게했습니다. 하나뿐만 아니라 3 개의 새로운 버전이 소개되었습니다.
법률 교수는 Meta와의 AI 저작권 전투에서 저자를 지원합니다. 법률 교수는 Meta와의 AI 저작권 전투에서 저자를 지원합니다. 한 저작권법 교수 그룹은 기술 대기업이 저자의 동의없이 전자 책에 대해 LLAMA AI 모델을 전자 책으로 훈련 시켰다고 주장하면서 메타를 고소하는 저자의지지를 주었다. 교수들은 금요일 캘리포니아 북부 지역의 미국 지방 법원에서 아미 쿠스 브리핑을 제출했습니다.
Openai Strikes Back : AI 경쟁자를 훼손하려는 노력으로 Elon Musk를 고소합니다. Openai Strikes Back : AI 경쟁자를 훼손하려는 노력으로 Elon Musk를 고소합니다. Openai는 공동 설립자 인 Elon Musk와 그의 경쟁 AI 회사 인 Xai에 대한 치열한 법적 반격을 시작했습니다. Openai는 진행중인 불화의 극적인 에스컬레이션에서 Musk가 "끊임없는"및 "악의적 인"캠페인을 시작하여 그가 시작한 회사를 훼손하기위한 "악의적 인"캠페인을 촉구했다고 비난합니다. 법원에 따르면 d
सूचना (25)
FrankMartínez
FrankMartínez 11 अप्रैल 2025 2:36:50 पूर्वाह्न GMT

So, Meta's been using copyrighted stuff to train their AI? That's shady as hell. No wonder their AI models are so good, but at what cost? Feels wrong to me. They need to clean up their act or face the music. Thoughts?

WilliamYoung
WilliamYoung 11 अप्रैल 2025 2:36:50 पूर्वाह्न GMT

メタが著作権物を使ってAIを訓練していたなんて、めっちゃ怪しいですね。だからこそAIモデルが優れているのかもしれないけど、その代償は?私には間違っているように感じます。メタは行動を改めるか、責任を取るべきです。どう思いますか?

HenryJackson
HenryJackson 11 अप्रैल 2025 2:36:50 पूर्वाह्न GMT

메타가 저작권 있는 자료를 AI 훈련에 사용했다니, 정말 불법적이네요. 그래서 AI 모델이 좋은 건지 모르겠지만, 그 대가는 뭘까요? 제겐 잘못된 일로 느껴져요. 메타는 행동을 개선하거나 책임을 져야 합니다. 어떻게 생각하세요?

HarryRoberts
HarryRoberts 11 अप्रैल 2025 2:36:50 पूर्वाह्न GMT

Então, a Meta estava usando material com direitos autorais para treinar seu AI? Isso é muito suspeito. Não é de se admirar que seus modelos de AI sejam tão bons, mas a que custo? Parece errado para mim. Eles precisam se corrigir ou enfrentar as consequências. O que vocês acham?

JoseJackson
JoseJackson 11 अप्रैल 2025 2:36:50 पूर्वाह्न GMT

Así que, ¿Meta ha estado usando material con derechos de autor para entrenar su IA? Eso es muy sospechoso. No es de extrañar que sus modelos de IA sean tan buenos, pero a qué costo. Me parece mal. Necesitan limpiar su acto o enfrentar las consecuencias. ¿Qué opinan?

AlbertHill
AlbertHill 10 अप्रैल 2025 7:16:25 अपराह्न GMT

So, Meta's been using copyrighted stuff to train their AI? That's pretty shady if you ask me. I mean, I get wanting to improve your AI, but at what cost? This lawsuit might just open a can of worms. Thoughts?

शीर्ष समाचार
यूएस डेटा सेंटर के लिए ट्वीक्स 76 GW नई बिजली क्षमता को अनलॉक कर सकते हैं नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है वाइल्डफायर डिटेक्शन में एक सफलता: कैसे उपग्रहों का एक नया नक्षत्र पहले छोटे जंगल की आग का पता लगा सकता है कंबियम का एआई कचरे की लकड़ी को लकड़ी में बदल देता है एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया Openai की AI ने paywalled O'Reilly पुस्तकों पर प्रशिक्षित किया, शोधकर्ताओं का दावा है AI एक अधिक कुशल यूके सार्वजनिक क्षेत्र को अनलॉक करने की कुंजी हो सकती है Google.org ने सरकारी कर्मचारियों के लिए $ 15M AI प्रशिक्षण अनुदान का अनावरण किया डीप कॉगिटो के एलएलएम आईडीए का उपयोग करते हुए समान आकार के मॉडल को बेहतर बनाते हैं
अधिक
शीर्ष पर वापस
OR