Option
Heim Nachricht Meta -Mitarbeiter, die mit der Verwendung von urheberrechtlich geschützten Inhalten für KI -Schulungen diskutiert wurden, enthüllen Gerichtsakten

Meta -Mitarbeiter, die mit der Verwendung von urheberrechtlich geschützten Inhalten für KI -Schulungen diskutiert wurden, enthüllen Gerichtsakten

Veröffentlichungsdatum Veröffentlichungsdatum 10. April 2025
Autor Autor JosephEvans
Ansichten Ansichten 16

Meta -Mitarbeiter, die mit der Verwendung von urheberrechtlich geschützten Inhalten für KI -Schulungen diskutiert wurden, enthüllen Gerichtsakten

Seit Jahren diskutieren Meta -Mitarbeiter die Verwendung von urheberrechtlich geschützten Materialien, die mit potenziell zwielichtigen Mitteln erhalten wurden, um die KI -Modelle des Unternehmens laut Gerichtsdokumenten auszubilden, die am Donnerstag nicht versiegelt wurden.

Diese Dokumente waren Teil der laufenden Klage Kadrey gegen Meta, einer von mehreren AI -Urheberrechtsstreitigkeiten, die sich durch das US -Gerichtssystem bewegten. Meta argumentiert, dass die Verwendung von IP-geschützten Werken, insbesondere Büchern, für das Training ihrer Modelle unter "faire Verwendung" fällt. Die Kläger, darunter die Autoren Sarah Silverman und Ta-Nehisi Coates, sind sich jedoch stark nicht einig.

Frühere Einreichungen in dem Fall deuten darauf hin, dass Meta -CEO Mark Zuckerberg die Verwendung von urheberrechtlich geschützten Inhalten für Schulungen genehmigt hatte und dass Meta die Verhandlung von Lizenzverträgen mit Buchverlagern eingestellt hatte. Die neu nicht versiegelten Dokumente, die interne Arbeitsplätze zwischen Meta -Mitarbeitern enthalten, bieten den detailliertesten Einblick in die Art und Weise, wie Meta möglicherweise urheberrechtlich geschützte Daten verwendet hat, um seine Modelle zu schulen, einschließlich derer in der Lama -Familie.

In einem Chat sprachen Meta -Mitarbeiter, darunter Melanie Kambadur, ein Senior Manager im Lama Model Research Team von Meta, über Schulungsmodelle zu Arbeiten, von denen sie wussten, dass sie rechtlich riskant sein könnten.

"Meine Einstellung ist (im Sinne von 'Affinging, nicht die Erlaubnis'): Wir sollten die Bücher schnappen und die Manager entscheiden lassen", schrieb Xavier Martinet, ein Meta -Forschungsingenieur, in einem Chat im Februar 2023 laut den Einreichungen. "Deshalb haben sie diese Gen Ai Org geschaffen: damit wir mehr Risiken eingehen können."

Martinet schlug vor, E-Books zu Einzelhandelspreisen zu kaufen, um ein Schulungssatz zu erstellen, anstatt Lizenzverträge mit Verlage zu verhandeln. Als ein anderer Mitarbeiter auf die potenziellen rechtlichen Probleme bei der Verwendung von nicht autorisierten urheberrechtlich geschützten Materialien hinwies, verdoppelte sich Martinet und stellte fest, dass "eine Start -ups" -Startups wahrscheinlich bereits Raubbücher für die Ausbildung verwendeten.

"Ich meine, schlimmster Fall: Wir finden "Meine zwei Cents wieder: Der direkte Umgang mit Publishers braucht ewig ..."

Im selben Chat stellte Kambadur, der erwähnte, dass Meta mit Scribd und anderen Plattformen für Lizenzen verhandelte, fest, dass die Anwälte von Meta, obwohl sie "öffentlich verfügbare Daten" für die Schulung für Schulungen benötigten, "weniger konservativ" wurden, um solche Genehmigungen zu gewähren.

"Ja, wir müssen noch Lizenzen oder Genehmigungen für öffentlich verfügbare Daten erhalten", sagte Kambadur laut den Einreichungen. "Der Unterschied besteht nun darin, dass wir mehr Geld, mehr Anwälte, mehr Geschäftsentwicklungshilfe, die Fähigkeit haben, Geschwindigkeit zu fasten und zu eskalieren, und die Anwälte sind mit Genehmigungen etwas weniger vorsichtig."

Gespräche von Libgen

In einem anderen in den Einreichungen erwähnten Arbeitsplatten erörterte Kambadur die Möglichkeit, Libgen, einen "Links -Aggregator", zu verwenden, der Zugriff auf urheberrechtlich geschützte Werke von Publishern als Alternative zu lizenzierten Datenquellen bietet.

Libgen wurde mit zahlreichen Klagen konfrontiert, wurde zur Schließung angewiesen und wurde wegen Urheberrechtsverletzungen mit einer Geldstrafe von Millionen Dollar belegt. Einer von Kambadurs Kollegen antwortete mit einem Screenshot eines Google -Suchergebnisses für Libgen, das den Snippet "Nein, Libgen ist nicht legal" enthielt.

Einige Entscheidungsträger von Meta schienen zu glauben, dass die Nichtverwaltung von Libgen für das Modelltraining laut den Einreichungen die Wettbewerbsfähigkeit von Meta im KI-Rennen ernsthaft beeinflussen könnte.

In einer E-Mail an Meta AI VP Joelle Pineau, Sony Theakanath, Director of Product Management bei Meta, namens Libgen "Essential, um SOTA-Nummern in allen Kategorien zu erfüllen", wobei sie sich auf die Erreichung der besten KI-Modellleistung und Benchmark-Kategorien beziehen.

Theakanath skizzierte auch "Minderungen" in der E -Mail, um die rechtliche Exposition von Meta zu verringern, z. B. das Entfernen von Daten aus Libgen, die "klar als Raubkopie/gestohlen" gekennzeichnet waren und die Verwendung von Libgen -Datensätzen für die Schulung nicht öffentlich offenlegen. "Wir würden die Verwendung von Libgen -Datensätzen, die zum Training verwendet werden, nicht offenlegen", schrieb Theakanath.

In der Praxis beinhalteten diese Minderungen die Suche nach Libgen -Dateien nach Wörtern wie "gestohlen" oder "Raubkopien" gemäß den Einreichungen.

In einem Arbeits-Chat erwähnte Kambadur, dass das KI-Team von Meta auch Modelle anpasste, um "iP-riskante Eingabeaufforderungen zu vermeiden"-dh die Modelle konfigurierten es, Fragen zu beantworten, wie "die ersten drei Seiten von" Harry Potter "und" The Sorcerer's Stone "reproduzieren" oder "Sagen Sie mir, auf welchen E-Books Sie trainiert wurden".

Die Einreichungen legen auch nahe, dass Meta möglicherweise Reddit-Daten für eine Art von Modelltraining abgeschafft hat, möglicherweise indem sie das Verhalten einer Drittanbieter-App namens Pushshift nachahmt. Insbesondere kündigte Reddit im April 2023 an, dass es vorhatte, KI -Unternehmen für den Zugriff auf Daten für die Modelltraining zu berechnen.

In einem Chat im März 2024 sagte Chaya Nayak, Direktorin des Produktmanagements bei META von Generative AI Org, dass die Meta -Führung in Betracht gezogen habe, vergangene Entscheidungen an Schulungssätzen zu "überschrieben", einschließlich der Entscheidung, keine Quora -Inhalte oder lizenzierten Bücher und wissenschaftlichen Artikel zu verwenden, um sicherzustellen, dass die Modelle des Unternehmens genügend Trainingsdaten haben.

Nayak implizierte, dass die Erstanbieter-Schulungsdatensätze von Meta-wie Facebook- und Instagram-Posts, Text aus Videos auf Meta-Plattformen und bestimmte Meta für Geschäftsnachrichten-nicht ausreichend waren. "Wir brauchen mehr Daten", schrieb sie.

Die Kläger in Kadrey gegen Meta haben ihre Beschwerde seit der Einreichung des Falls vor dem US -Bezirksgericht für den Northern District of California, San Francisco, im Jahr 2023 mehrmals geändert. In der jüngsten Änderung wird behauptet, dass Meta unter anderem bestimmte Bevölkerungsbücher mit einem Lizenz zur Entschlossenheit verglichen hat, einen Lizenzvertrag mit einem Publisker zu verfolgen.

In einem Anzeichen dafür, wie ernst die Meta die rechtlichen Anteile ansieht, hat das Unternehmen sein Verteidigungsteam in dem Fall zwei Rechtsstreitiger des Obersten Gerichtshofs von der Anwaltskanzlei Paul Weiss hinzugefügt.

Meta antwortete nicht sofort auf eine Anfrage nach Kommentaren.

Verwandter Artikel
Meta verteidigt LLAMA 4 Release, zitiert Fehler als Ursache für Berichte mit gemischter Qualität Meta verteidigt LLAMA 4 Release, zitiert Fehler als Ursache für Berichte mit gemischter Qualität Über das Wochenende überraschte Meta, das Kraftpaket hinter Facebook, Instagram, WhatsApp und Quest VR alle, indem sie ihr neuestes KI-Sprachmodell Lama 4 enthüllte. Nicht nur eine, sondern drei neue Versionen wurden vorgestellt, jeweils aus der Architektur der "Mischung der Experten" -Ancharitur verbesserte Fähigkeiten ausgestattet
Rechtsprofessoren unterstützen Autoren im KI -Urheberrecht gegen Meta. Rechtsprofessoren unterstützen Autoren im KI -Urheberrecht gegen Meta. Eine Gruppe von Copyright-Rechtsprofessoren hat ihre Unterstützung hinter Autoren verklagt, die Meta verklagen, und behauptet, der Tech-Riese habe seine LLAMA-AI-Modelle auf E-Books ohne Zustimmung der Autoren ausgebildet. Die Professoren haben am Freitag einen Amicus -Brief eingereicht
OpenAI -Streik zurück: verklagt Elon Musk wegen mutmaßlicher Bemühungen, den AI -Konkurrenten zu untergraben OpenAI -Streik zurück: verklagt Elon Musk wegen mutmaßlicher Bemühungen, den AI -Konkurrenten zu untergraben OpenAI hat einen heftigen Rechtsangriff gegen seinen Mitbegründer Elon Musk und seine konkurrierende KI-Firma XAI gestartet. In einer dramatischen Eskalation ihrer anhaltenden Fehde beschuldigt OpenAI Musk, eine "unerbittliche" und "bösartige" Kampagne durchzuführen, um das Unternehmen zu untergraben, das er beibehalten hat. Nach Gericht d
Kommentare (25)
0/200
FrankMartínez
FrankMartínez 11. April 2025 02:36:50 GMT

So, Meta's been using copyrighted stuff to train their AI? That's shady as hell. No wonder their AI models are so good, but at what cost? Feels wrong to me. They need to clean up their act or face the music. Thoughts?

WilliamYoung
WilliamYoung 11. April 2025 02:36:50 GMT

メタが著作権物を使ってAIを訓練していたなんて、めっちゃ怪しいですね。だからこそAIモデルが優れているのかもしれないけど、その代償は?私には間違っているように感じます。メタは行動を改めるか、責任を取るべきです。どう思いますか?

HenryJackson
HenryJackson 11. April 2025 02:36:50 GMT

메타가 저작권 있는 자료를 AI 훈련에 사용했다니, 정말 불법적이네요. 그래서 AI 모델이 좋은 건지 모르겠지만, 그 대가는 뭘까요? 제겐 잘못된 일로 느껴져요. 메타는 행동을 개선하거나 책임을 져야 합니다. 어떻게 생각하세요?

HarryRoberts
HarryRoberts 11. April 2025 02:36:50 GMT

Então, a Meta estava usando material com direitos autorais para treinar seu AI? Isso é muito suspeito. Não é de se admirar que seus modelos de AI sejam tão bons, mas a que custo? Parece errado para mim. Eles precisam se corrigir ou enfrentar as consequências. O que vocês acham?

JoseJackson
JoseJackson 11. April 2025 02:36:50 GMT

Así que, ¿Meta ha estado usando material con derechos de autor para entrenar su IA? Eso es muy sospechoso. No es de extrañar que sus modelos de IA sean tan buenos, pero a qué costo. Me parece mal. Necesitan limpiar su acto o enfrentar las consecuencias. ¿Qué opinan?

AlbertHill
AlbertHill 10. April 2025 19:16:25 GMT

So, Meta's been using copyrighted stuff to train their AI? That's pretty shady if you ask me. I mean, I get wanting to improve your AI, but at what cost? This lawsuit might just open a can of worms. Thoughts?

Zurück nach oben
OR