Die Autoren verklagen Openai und Meta wegen angeblicher Urheberrechtsverletzung
Sarah Silverman und Co-Autoren ergreifen rechtliche Schritte gegen Meta und OpenAI
Sarah Silverman, zusammen mit den Autoren Richard Kadfrey und Christopher Golden, haben rechtliche Verfahren gegen Meta und OpenAI eingeleitet und werfen beiden Technologieunternehmen Urheberrechtsverletzungen vor. Die Autoren behaupten, dass ihre urheberrechtlich geschützten Bücher ohne ihre Zustimmung verwendet wurden, um die großen Sprachmodelle (LLMs) zu trainieren, die OpenAIs ChatGPT und Metas LLaMa antreiben.
Die Klagen sind getrennt, wobei jede auf eines der Unternehmen abzielt. Der Kern ihres Arguments ist, dass ihre Werke in die Trainingsdatensätze für diese LLMs aufgenommen wurden, was sie als unbefugte Nutzung ihres Materials betrachten.
Verständnis großer Sprachmodelle
Ein LLM ist ein fortschrittlicher KI-Algorithmus, der aus riesigen Mengen an Textdaten lernt, einschließlich Büchern und Internetinhalten. Dieses Training ermöglicht es dem Modell, Sprachmuster, Grammatik und Kontext zu verstehen, was letztendlich dazu führt, dass es Texte generieren kann, die menschliches Schreiben nachahmen, und konversationelle Interaktionen mit Nutzern ermöglicht.
Die Klagen behaupten, dass diese Modelle im Wesentlichen das urheberrechtlich geschützte Material Tausender Autoren ohne deren Erlaubnis, Vergütung oder Anerkennung „remixen“.
Der breitere Kontext von KI und Urheberrecht
Die Frage der Urheberrechtsverletzung ist seit dem Aufkommen von ChatGPT, das einen Anstieg generativer KI-Technologien auslöste, zu einem bedeutenden Problem geworden. Dies hat Fragen über die Auswirkungen von KI auf Kreativität und den Urheberrechtsprozess aufgeworfen.
Die Klagen behaupten, dass die LLMs mit illegal beschafften Materialien trainiert wurden, wie solchen, die auf „Schattenbibliothek“-Websites gefunden wurden. Die Klage gegen OpenAI erwähnt speziell den „OpenAI Books2 Datensatz“, der vermutlich etwa 294.000 Titel umfasst, die von berüchtigten Seiten wie Library Genesis, Z-Library, Sci-Hub und Bibliotik stammen, die über Torrent-Systeme zugänglich sind.
Ähnlich verweist die Klage gegen Meta auf zwei Quellen für ihre Trainingsdaten: Project Gutenberg, ein Archiv von Büchern, die nicht mehr urheberrechtlich geschützt sind, und den „Books3 Abschnitt des ThePile“-Datensatzes auf Hugging Face, der offenbar die gesamte Bibliotik-Sammlung umfasst.
Rechtliche Vertretung und verwandte Fälle
Sarah Silverman und ihre Mitkläger werden von den Anwälten Joseph Savery und Matthew Butterick vertreten. Dieselben Anwälte bearbeiten auch eine separate Klage, die im Juni von den Autoren Mona Awad und Paul Tremblay gegen OpenAI eingereicht wurde, ebenfalls wegen angeblicher Urheberrechtsverletzungen.

Die laufenden rechtlichen Auseinandersetzungen verdeutlichen die Spannung zwischen KI-Entwicklung und den Rechten der Inhaltsersteller, ein Thema, das sich mit dem Fortschreiten der KI-Technologie weiterentwickelt.
Verwandter Artikel
Google will Investitionen in Anthropic aufstocken – Gesamtvolumen könnte bis zu 40 Milliarden Dollar betragen
Im rasanten Wettlauf um die KI gehen die großen Tech-Konzerne immer mutigere Schritte. Jüngsten Berichten zufolge plant Google, bis zu 10 Milliarden Dollar in das KI-Startup Anthropic zu investieren –
Die kostenlose Open-Source-KI-Schach-Engine „Maia 3“ wurde veröffentlicht, um das menschliche Spiel zu verbessern
Das Maia-Chess-Team hat eine neue Open-Source-Schach-Engine namens Maia 3 veröffentlicht, die auf der Grundlage von 250 Millionen echten Partien trainiert wurde. Sie erreicht eine Elo-Zahl von etwa 18
Der Boom bei KI-Risikokapital lässt den Umsatz in einer einzigen Saison die Billionen-Yuan-Marke überschreiten und löst eine neue Innovationswelle aus
Das weltweite Risikokapital im Bereich der künstlichen Intelligenz steigt rasant an. Im ersten Quartal dieses Jahres wurden fast 600 Finanzierungsrunden im Zusammenhang mit KI abgeschlossen, deren Ges
Empfehlungen zu verwandten Spezialthemen
Kommentare (20)
Sarah Silverman mit einem Rechtsstreit gegen Tech-Giganten ist eine mutige, aber vielleicht aussichtslose Sache. KI-Trainingsdaten und Urheberrecht — das wird noch jahrelang juristische Diskussionen füttern. Irgendwie wirkt es wie David gegen Goliath, aber dieses Mal haben die Goliaths Zugriff auf nahezu alle digitalisierten Bücher der Welt. Vielleicht braucht es solche Klagen, um überhaupt einen gesetzlichen Rahmen zu schaffen. 🤔
이 뉴스 보니까 생각이 좀 복잡해지네요. AI가 학습하는 과정에서 저작권 문제가 계속 불거지는군요. 실버먼 작가분들 소송이 어떻게 될지 궁금하긴 한데, 결국 법원 판단에 달린 문제 같아요. AI 발전을 위해선 데이터 접근이 필요하지만 창작자의 권리도 분명히 보호돼야 하고... 🤔 앞으로 이런 논쟁이 더 많아질 텐데, 관련 법이 빨리 정립됐으면 좋겠어요.
GPTの学習データってやっぱり著作権が問題になるよねー。この訴訟、どう転ぶか気になります。AI進化には大量のデータが必須だけど、クリエイターの権利もきちんと守れる仕組みが必要だな。勝敗が今後の生成AIビジネスに大きな影響を与えそう。
This lawsuit is wild! 😮 I mean, authors like Sarah Silverman going after Meta and OpenAI for copyright? That’s a bold move. Makes me wonder if AI’s just gobbling up books like a kid with candy. Hope this sparks a bigger chat about ethics in tech!
This lawsuit is wild! 😮 Silverman and others taking on Meta and OpenAI for copyright issues? I’m curious how this plays out—could set a big precedent for AI and creativity!
Sarah Silverman und Co-Autoren ergreifen rechtliche Schritte gegen Meta und OpenAI
Sarah Silverman, zusammen mit den Autoren Richard Kadfrey und Christopher Golden, haben rechtliche Verfahren gegen Meta und OpenAI eingeleitet und werfen beiden Technologieunternehmen Urheberrechtsverletzungen vor. Die Autoren behaupten, dass ihre urheberrechtlich geschützten Bücher ohne ihre Zustimmung verwendet wurden, um die großen Sprachmodelle (LLMs) zu trainieren, die OpenAIs ChatGPT und Metas LLaMa antreiben.
Die Klagen sind getrennt, wobei jede auf eines der Unternehmen abzielt. Der Kern ihres Arguments ist, dass ihre Werke in die Trainingsdatensätze für diese LLMs aufgenommen wurden, was sie als unbefugte Nutzung ihres Materials betrachten.
Verständnis großer Sprachmodelle
Ein LLM ist ein fortschrittlicher KI-Algorithmus, der aus riesigen Mengen an Textdaten lernt, einschließlich Büchern und Internetinhalten. Dieses Training ermöglicht es dem Modell, Sprachmuster, Grammatik und Kontext zu verstehen, was letztendlich dazu führt, dass es Texte generieren kann, die menschliches Schreiben nachahmen, und konversationelle Interaktionen mit Nutzern ermöglicht.
Die Klagen behaupten, dass diese Modelle im Wesentlichen das urheberrechtlich geschützte Material Tausender Autoren ohne deren Erlaubnis, Vergütung oder Anerkennung „remixen“.
Der breitere Kontext von KI und Urheberrecht
Die Frage der Urheberrechtsverletzung ist seit dem Aufkommen von ChatGPT, das einen Anstieg generativer KI-Technologien auslöste, zu einem bedeutenden Problem geworden. Dies hat Fragen über die Auswirkungen von KI auf Kreativität und den Urheberrechtsprozess aufgeworfen.
Die Klagen behaupten, dass die LLMs mit illegal beschafften Materialien trainiert wurden, wie solchen, die auf „Schattenbibliothek“-Websites gefunden wurden. Die Klage gegen OpenAI erwähnt speziell den „OpenAI Books2 Datensatz“, der vermutlich etwa 294.000 Titel umfasst, die von berüchtigten Seiten wie Library Genesis, Z-Library, Sci-Hub und Bibliotik stammen, die über Torrent-Systeme zugänglich sind.
Ähnlich verweist die Klage gegen Meta auf zwei Quellen für ihre Trainingsdaten: Project Gutenberg, ein Archiv von Büchern, die nicht mehr urheberrechtlich geschützt sind, und den „Books3 Abschnitt des ThePile“-Datensatzes auf Hugging Face, der offenbar die gesamte Bibliotik-Sammlung umfasst.
Rechtliche Vertretung und verwandte Fälle
Sarah Silverman und ihre Mitkläger werden von den Anwälten Joseph Savery und Matthew Butterick vertreten. Dieselben Anwälte bearbeiten auch eine separate Klage, die im Juni von den Autoren Mona Awad und Paul Tremblay gegen OpenAI eingereicht wurde, ebenfalls wegen angeblicher Urheberrechtsverletzungen.
Die laufenden rechtlichen Auseinandersetzungen verdeutlichen die Spannung zwischen KI-Entwicklung und den Rechten der Inhaltsersteller, ein Thema, das sich mit dem Fortschreiten der KI-Technologie weiterentwickelt.
Google will Investitionen in Anthropic aufstocken – Gesamtvolumen könnte bis zu 40 Milliarden Dollar betragen
Im rasanten Wettlauf um die KI gehen die großen Tech-Konzerne immer mutigere Schritte. Jüngsten Berichten zufolge plant Google, bis zu 10 Milliarden Dollar in das KI-Startup Anthropic zu investieren –
Der Boom bei KI-Risikokapital lässt den Umsatz in einer einzigen Saison die Billionen-Yuan-Marke überschreiten und löst eine neue Innovationswelle aus
Das weltweite Risikokapital im Bereich der künstlichen Intelligenz steigt rasant an. Im ersten Quartal dieses Jahres wurden fast 600 Finanzierungsrunden im Zusammenhang mit KI abgeschlossen, deren Ges
Sarah Silverman mit einem Rechtsstreit gegen Tech-Giganten ist eine mutige, aber vielleicht aussichtslose Sache. KI-Trainingsdaten und Urheberrecht — das wird noch jahrelang juristische Diskussionen füttern. Irgendwie wirkt es wie David gegen Goliath, aber dieses Mal haben die Goliaths Zugriff auf nahezu alle digitalisierten Bücher der Welt. Vielleicht braucht es solche Klagen, um überhaupt einen gesetzlichen Rahmen zu schaffen. 🤔
이 뉴스 보니까 생각이 좀 복잡해지네요. AI가 학습하는 과정에서 저작권 문제가 계속 불거지는군요. 실버먼 작가분들 소송이 어떻게 될지 궁금하긴 한데, 결국 법원 판단에 달린 문제 같아요. AI 발전을 위해선 데이터 접근이 필요하지만 창작자의 권리도 분명히 보호돼야 하고... 🤔 앞으로 이런 논쟁이 더 많아질 텐데, 관련 법이 빨리 정립됐으면 좋겠어요.
GPTの学習データってやっぱり著作権が問題になるよねー。この訴訟、どう転ぶか気になります。AI進化には大量のデータが必須だけど、クリエイターの権利もきちんと守れる仕組みが必要だな。勝敗が今後の生成AIビジネスに大きな影響を与えそう。
This lawsuit is wild! 😮 I mean, authors like Sarah Silverman going after Meta and OpenAI for copyright? That’s a bold move. Makes me wonder if AI’s just gobbling up books like a kid with candy. Hope this sparks a bigger chat about ethics in tech!
This lawsuit is wild! 😮 Silverman and others taking on Meta and OpenAI for copyright issues? I’m curious how this plays out—could set a big precedent for AI and creativity!





Heim






