विकल्प
घर
समाचार
मेटा स्टाफ ने एआई प्रशिक्षण के लिए कॉपीराइट की गई सामग्री का उपयोग करके चर्चा की, कोर्ट फाइलिंग से पता चलता है

मेटा स्टाफ ने एआई प्रशिक्षण के लिए कॉपीराइट की गई सामग्री का उपयोग करके चर्चा की, कोर्ट फाइलिंग से पता चलता है

10 अप्रैल 2025
65

मेटा स्टाफ ने एआई प्रशिक्षण के लिए कॉपीराइट की गई सामग्री का उपयोग करके चर्चा की, कोर्ट फाइलिंग से पता चलता है

वर्षों से, मेटा के कर्मचारी गुरुवार को अनसुना कर दिए गए अदालती दस्तावेजों के अनुसार, कंपनी के एआई मॉडल को प्रशिक्षित करने के लिए, संभावित छायादार साधनों के माध्यम से प्राप्त कॉपीराइट सामग्री के उपयोग पर चर्चा कर रहे हैं।

ये दस्तावेज चल रहे मुकदमे काद्रे बनाम मेटा का हिस्सा थे, जो कई एआई कॉपीराइट विवादों में से एक है, जो अमेरिकी अदालत प्रणाली के माध्यम से अपना रास्ता बना रहा था। मेटा का तर्क है कि उनके मॉडल को प्रशिक्षित करने के लिए आईपी-संरक्षित कार्यों, विशेष रूप से पुस्तकों का उपयोग करना "उचित उपयोग" के अंतर्गत आता है। हालांकि, लेखक सारा सिल्वरमैन और टा-नेहिसी कोट्स सहित वादी दृढ़ता से असहमत हैं।

पहले मामले में फाइलिंग ने सुझाव दिया था कि मेटा के सीईओ मार्क जुकरबर्ग ने प्रशिक्षण के लिए कॉपीराइट सामग्री के उपयोग को मंजूरी दे दी थी और मेटा ने पुस्तक प्रकाशकों के साथ लाइसेंसिंग सौदों पर बातचीत करना बंद कर दिया था। नए अनसुलझे दस्तावेज, जिसमें मेटा कर्मचारियों के बीच आंतरिक कार्य चैट शामिल हैं, सबसे विस्तृत अंतर्दृष्टि प्रदान करते हैं कि मेटा ने अपने मॉडलों को प्रशिक्षित करने के लिए कॉपीराइट डेटा का उपयोग कैसे किया हो सकता है, जिसमें लामा परिवार भी शामिल है।

एक चैट में, मेटा के लामा मॉडल रिसर्च टीम के एक वरिष्ठ प्रबंधक मेलानी कंबादुर सहित मेटा के कर्मचारियों ने उन कार्यों पर प्रशिक्षण मॉडल के बारे में बात की, जिन्हें वे जानते थे कि वे कानूनी रूप से जोखिम भरा हो सकते हैं।

फाइलिंग के अनुसार, 2023 फरवरी की चैट में मेटा रिसर्च इंजीनियर, जेवियर मार्टिनेट ने लिखा, "मेरा टेक (माफी पूछें, अनुमति नहीं, अनुमति नहीं ') की भावना में है: हमें पुस्तकों को हड़पना चाहिए और निष्पादित करना चाहिए।" "यही कारण है कि उन्होंने इस जनरल एआई ऑर्ग को बनाया: इसलिए हम अधिक जोखिम उठा सकते हैं।"

मार्टिनेट ने प्रकाशकों के साथ लाइसेंसिंग सौदों पर बातचीत करने के बजाय एक प्रशिक्षण सेट बनाने के लिए खुदरा कीमतों पर ई-बुक खरीदने का सुझाव दिया। जब एक अन्य कर्मचारी ने अनधिकृत कॉपीराइट सामग्री का उपयोग करने के साथ संभावित कानूनी मुद्दों को इंगित किया, तो मार्टिनेट ने दोगुना हो गया, यह देखते हुए कि "एक गज़िलियन" स्टार्टअप पहले से ही प्रशिक्षण के लिए पायरेटेड पुस्तकों का उपयोग कर रहे थे।

"मेरा मतलब है, सबसे खराब मामला: हमें पता चलता है कि यह ठीक है, जबकि एक गजिलियन स्टार्टअप्स ने बिटटोरेंट पर सिर्फ किताबों के टन पायरेट किए हैं," मार्टिनेट ने फाइलिंग के अनुसार लिखा है। "मेरे दो सेंट फिर से: प्रकाशकों के साथ सीधे व्यवहार करना हमेशा के लिए लेता है ..."

एक ही चैट में, कांबाडुर, जिन्होंने उल्लेख किया कि मेटा लाइसेंस के लिए Scribd और अन्य प्लेटफार्मों के साथ बातचीत कर रहा था, ने कहा कि प्रशिक्षण के लिए "सार्वजनिक रूप से उपलब्ध डेटा" का उपयोग करने के दौरान अभी भी अनुमोदन की आवश्यकता होगी, मेटा के वकील इस तरह के अनुमोदन देने के बारे में "कम रूढ़िवादी" बन रहे थे।

"हाँ, हमें अभी भी सार्वजनिक रूप से उपलब्ध आंकड़ों के लिए लाइसेंस या अनुमोदन प्राप्त करने की आवश्यकता है," कंबादुर ने कहा, फाइलिंग के अनुसार। "अब अंतर यह है कि हमारे पास अधिक पैसा है, अधिक वकील, अधिक व्यवसाय विकास सहायता, तेजी से ट्रैक करने की क्षमता और गति के लिए आगे बढ़ें, और वकीलों को अनुमोदन के साथ थोड़ा कम सतर्क किया जा रहा है।"

Libgen की बातचीत

फाइलिंग में उल्लिखित एक अन्य कार्य चैट में, कांबाडुर ने लिबगेन, एक "लिंक एग्रीगेटर" का उपयोग करने की संभावना पर चर्चा की, जो लाइसेंस प्राप्त डेटा स्रोतों के विकल्प के रूप में प्रकाशकों से कॉपीराइट किए गए कार्यों तक पहुंच प्रदान करता है।

लिबगेन को कई मुकदमों का सामना करना पड़ा है, उन्हें बंद करने का आदेश दिया गया है, और कॉपीराइट उल्लंघन के लिए लाखों डॉलर का जुर्माना लगाया गया है। कम्बादुर के सहयोगियों में से एक ने लिबगेन के लिए Google खोज परिणाम के स्क्रीनशॉट के साथ जवाब दिया, जिसमें स्निपेट शामिल था "नहीं, लिबजेन कानूनी नहीं है।"

मेटा में कुछ निर्णय लेने वालों का मानना ​​था कि मॉडल प्रशिक्षण के लिए लिबगेन का उपयोग नहीं करना, एआई दौड़ में मेटा की प्रतिस्पर्धा को गंभीरता से प्रभावित कर सकता है, फाइलिंग के अनुसार।

मेटा एआई वीपी जोले पिनेउ को एक ईमेल में, मेटा में उत्पाद प्रबंधन के निदेशक सोनी थीकनाथ, ने लिबगेन कहा, "सभी श्रेणियों में SOTA नंबरों को पूरा करने के लिए आवश्यक," सबसे अच्छा, अत्याधुनिक (SOTA) AI मॉडल प्रदर्शन और बेंचमार्क श्रेणियों को प्राप्त करने का उल्लेख करते हुए।

मेटा के कानूनी जोखिम को कम करने के लिए ईमेल में "माइटिगेशन" को भी रेखांकित किया गया था, जैसे कि लिबगेन से डेटा को हटाना जो "स्पष्ट रूप से पायरेटेड/चोरी के रूप में चिह्नित था" और सार्वजनिक रूप से प्रशिक्षण के लिए लिबजेन डेटासेट के उपयोग का खुलासा नहीं किया। "हम प्रशिक्षित करने के लिए उपयोग किए जाने वाले लिबगेन डेटासेट के उपयोग का खुलासा नहीं करेंगे," थीकनाथ ने लिखा।

व्यवहार में, इन mitigations में फाइलिंग के अनुसार "चोरी" या "पायरेटेड" जैसे शब्दों के लिए libgen फ़ाइलों के माध्यम से खोज करना शामिल है।

एक वर्क चैट में, कांबाडुर ने उल्लेख किया कि मेटा की एआई टीम ने भी "आईपी रिस्की प्रॉम्प्ट से बचने के लिए मॉडल को समायोजित किया"-जिसका अर्थ है कि उन्होंने "हैरी पॉटर और सोर्सर स्टोन 'के पहले तीन पन्नों को पुन: पेश करने जैसे सवालों के जवाब देने से इनकार करने के लिए मॉडल को कॉन्फ़िगर किया या" मुझे बताएं कि आपको कौन सी ई-बुक्स पर प्रशिक्षित किया गया था। "

फाइलिंग यह भी बताती है कि मेटा ने कुछ प्रकार के मॉडल प्रशिक्षण के लिए Reddit डेटा को स्क्रैप किया हो सकता है, संभवतः पुशशिफ्ट नामक एक तृतीय-पक्ष ऐप के व्यवहार की नकल करके। विशेष रूप से, Reddit ने अप्रैल 2023 में घोषणा की कि उसने मॉडल प्रशिक्षण के लिए डेटा तक पहुंच के लिए AI कंपनियों को चार्ज करना शुरू करने की योजना बनाई है।

मार्च 2024 की एक चैट में, मेटा के जेनेरिक एआई ऑर्गन में उत्पाद प्रबंधन के निदेशक चाया नायक ने कहा कि मेटा नेतृत्व प्रशिक्षण सेटों पर पिछले निर्णयों पर "ओवरराइडिंग" पर विचार कर रहा था, जिसमें एक निर्णय शामिल था, जिसमें Quora सामग्री या लाइसेंस प्राप्त पुस्तकों और वैज्ञानिक लेखों का उपयोग नहीं किया गया था, ताकि यह सुनिश्चित हो सके कि कंपनी के मॉडल के पास पर्याप्त प्रशिक्षण डेटा था।

नायक ने कहा कि मेटा के प्रथम-पार्टी प्रशिक्षण डेटासेट-जैसे कि फेसबुक और इंस्टाग्राम पोस्ट, मेटा प्लेटफार्मों पर वीडियो से स्थानांतरित पाठ, और व्यावसायिक संदेशों के लिए कुछ मेटा-पर्याप्त नहीं थे। "हमें अधिक डेटा की आवश्यकता है," उसने लिखा।

काद्रे बनाम मेटा में वादी ने 2023 में कैलिफोर्निया के उत्तरी जिले, सैन फ्रांसिस्को डिवीजन के लिए अमेरिकी जिला अदालत में मामले को दर्ज करने के बाद से कई बार अपनी शिकायत में संशोधन किया है। नवीनतम संशोधन में यह आरोप लगाया गया है कि मेटा, अन्य दावों के साथ, कुछ पायरेटेड पुस्तकों की तुलना में यह तय करने के लिए कि लाइसेंस के लिए एक लाइसेंस के साथ उपलब्ध है, जो एक प्रकाशक के साथ उपलब्ध है।

मेटा कितनी गंभीरता से कानूनी दांव को देखती है, इस बात पर, कंपनी ने सर्वोच्च न्यायालय के दो मुकदमों को कानून फर्म पॉल वीस से मामले में अपनी रक्षा टीम में जोड़ा है।

मेटा ने टिप्पणी के लिए अनुरोध का तुरंत जवाब नहीं दिया।

संबंधित लेख
Meta AI在欧盟推出并实施限制 Meta AI在欧盟推出并实施限制 Meta的人工智能虚拟助手Meta AI终于在与欧洲隐私机构的激烈监管斗争中进入了欧盟。该公司周四宣布,这款类似聊天机器人的工具将在其一系列社交平台上集成,不过功能比美国市场上的要少。在另一项发展上,Meta向TechCrunch确认,Meta AI很快将在英国的WhatsApp上可用,从今年十月在Facebook、Instagram和Ray-Ban Met
OpenAI 聘请前Facebook应用负责人 OpenAI 聘请前Facebook应用负责人 菲吉·西莫加入 OpenAI 担任应用业务主管OpenAI 通过聘请现任 Instacart 首席执行官兼前 Facebook 应用负责人菲吉·西莫来领导其应用业务,引起了广泛关注。这一任命直接来自高层,OpenAI 首席执行官山姆·阿尔特曼在 X 上分享称,新职位将使他能够更多地专注于研究、计算和安全性。显然,他们正在为应用领域的一些令人兴奋的发展奠定基础
Meta预测到2035年生成性AI收入将达1.4万亿美元 Meta预测到2035年生成性AI收入将达1.4万亿美元 去年,Meta 大胆预测其生成式 AI 产品到 2025 年将产生 20 亿至 30 亿美元的收入。展望未来,他们预计到 2035 年将增长到惊人的 4600 亿至 1.4 万亿美元之间。这些预测是在周三浮出水面的法庭文件中披露的,当时正值书籍作者对 Meta 提起诉讼。他们指控该公司未经许可就用他们的作品训练 AI。然而,文件并未具体说明 Meta 如何定
सूचना (30)
FrankMartínez
FrankMartínez 11 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

So, Meta's been using copyrighted stuff to train their AI? That's shady as hell. No wonder their AI models are so good, but at what cost? Feels wrong to me. They need to clean up their act or face the music. Thoughts?

WilliamYoung
WilliamYoung 11 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

メタが著作権物を使ってAIを訓練していたなんて、めっちゃ怪しいですね。だからこそAIモデルが優れているのかもしれないけど、その代償は?私には間違っているように感じます。メタは行動を改めるか、責任を取るべきです。どう思いますか?

HenryJackson
HenryJackson 11 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

메타가 저작권 있는 자료를 AI 훈련에 사용했다니, 정말 불법적이네요. 그래서 AI 모델이 좋은 건지 모르겠지만, 그 대가는 뭘까요? 제겐 잘못된 일로 느껴져요. 메타는 행동을 개선하거나 책임을 져야 합니다. 어떻게 생각하세요?

HarryRoberts
HarryRoberts 11 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

Então, a Meta estava usando material com direitos autorais para treinar seu AI? Isso é muito suspeito. Não é de se admirar que seus modelos de AI sejam tão bons, mas a que custo? Parece errado para mim. Eles precisam se corrigir ou enfrentar as consequências. O que vocês acham?

JoseJackson
JoseJackson 11 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

Así que, ¿Meta ha estado usando material con derechos de autor para entrenar su IA? Eso es muy sospechoso. No es de extrañar que sus modelos de IA sean tan buenos, pero a qué costo. Me parece mal. Necesitan limpiar su acto o enfrentar las consecuencias. ¿Qué opinan?

AlbertHill
AlbertHill 11 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

So, Meta's been using copyrighted stuff to train their AI? That's pretty shady if you ask me. I mean, I get wanting to improve your AI, but at what cost? This lawsuit might just open a can of worms. Thoughts?

शीर्ष समाचार
Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया Adobe 10 विशिष्ट AI एजेंटों का अनावरण करता है: उनके व्यावसायिक अनुप्रयोगों की खोज करें दक्षिण कोरिया स्थानीय दुकानों में दीपसेक ऐप डाउनलोड करता है चैट की ऊर्जा का उपयोग अपेक्षा से कम है Openai का O3 मॉडल संभावित रूप से अधिक महंगा है जो शुरू में विचार की तुलना में संचालित होता है नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है
अधिक
शीर्ष पर वापस
OR