Les auteurs Sue Openai et Meta pour une violation présumée du droit d'auteur
Sarah Silverman et ses co-auteurs intentent une action en justice contre Meta et OpenAI
Sarah Silverman, ainsi que les auteurs Richard Kadfrey et Christopher Golden, ont engagé des poursuites judiciaires contre Meta et OpenAI, accusant les deux géants technologiques de violation du droit d'auteur. Les auteurs allèguent que leurs livres protégés par le droit d'auteur ont été utilisés sans leur consentement pour entraîner les grands modèles de langage (LLMs) alimentant ChatGPT d'OpenAI et LLaMa de Meta.
Les poursuites sont distinctes, chacune visant l'une des entreprises. Le cœur de leur argumentation est que leurs œuvres ont été incorporées dans les ensembles de données d'entraînement de ces LLMs, ce qu'ils considèrent comme une utilisation non autorisée de leur matériel.
Comprendre les grands modèles de langage
Un LLM est un algorithme d'IA avancé qui apprend à partir de vastes quantités de données textuelles, y compris des livres et du contenu internet. Cet entraînement permet au modèle de comprendre les schémas linguistiques, la grammaire et le contexte, lui permettant finalement de générer du texte imitant l'écriture humaine et de s'engager dans des interactions conversationnelles avec les utilisateurs.
Les poursuites soutiennent que ces modèles "remixent" essentiellement le matériel protégé par le droit d'auteur de milliers d'auteurs sans leur permission, compensation ou reconnaissance.
Le contexte plus large de l'IA et du droit d'auteur
La question de la violation du droit d'auteur est devenue une préoccupation majeure depuis l'apparition de ChatGPT, qui a déclenché une montée en puissance des technologies d'IA générative. Cela a soulevé des questions sur l'impact de l'IA sur la créativité et le processus de droit d'auteur.
Les poursuites affirment que les LLMs ont été entraînés à l'aide de matériels obtenus illégalement, tels que ceux trouvés sur des sites de "bibliothèques fantômes". La poursuite contre OpenAI mentionne spécifiquement l'ensemble de données "OpenAI Books2", qui inclurait environ 294 000 titres provenant de sites notoires comme Library Genesis, Z-Library, Sci-Hub et Bibliotik, accessibles via des systèmes de torrent.
De manière similaire, la poursuite contre Meta pointe deux sources pour leurs données d'entraînement : Project Gutenberg, une archive de livres qui ne sont plus sous droit d'auteur, et la "section Books3 de l'ensemble de données ThePile" sur Hugging Face, qui semble englober l'ensemble de la collection Bibliotik.
Représentation légale et affaires connexes
Sarah Silverman et ses co-plaignants sont représentés par les avocats Joseph Savery et Matthew Butterick. Ces mêmes avocats gèrent également une poursuite distincte déposée en juin contre OpenAI par les auteurs Mona Awad et Paul Tremblay, également pour des allégations de violation du droit d'auteur.

Les batailles juridiques en cours mettent en lumière la tension entre le développement de l'IA et les droits des créateurs de contenu, un sujet qui continue d'évoluer à mesure que la technologie de l'IA progresse.
Article connexe
Comprendre la nouvelle norme ETSI en matière de sécurité de l'IA
La norme ETSI EN 304 223 définit les exigences fondamentales en matière de sécurité pour l'intelligence artificielle que les organisations doivent intégrer dans leurs structures de gouvernance.Alors q
Gmail lance une boîte de réception personnalisée grâce à l'IA, des aperçus générés par l'IA dans la recherche, et bien plus encore
Google a lancé une nouvelle boîte de réception alimentée par l'IA pour Gmail, qui vous offre un aperçu personnalisé de vos tâches et vous tient informé des mises à jour importantes. Parallèlement, Gma
La première base de création de séries animées par IA de Baidu dans la province du Shandong voit le jour à Zibo
Le 27 avril, la province du Shandong a franchi une étape importante dans le domaine de la création culturelle numérique avec le lancement officiel de sa première base de création de séries animées bas
Recommandations de sujets spéciaux liés
commentaires (20)
Sarah Silverman mit einem Rechtsstreit gegen Tech-Giganten ist eine mutige, aber vielleicht aussichtslose Sache. KI-Trainingsdaten und Urheberrecht — das wird noch jahrelang juristische Diskussionen füttern. Irgendwie wirkt es wie David gegen Goliath, aber dieses Mal haben die Goliaths Zugriff auf nahezu alle digitalisierten Bücher der Welt. Vielleicht braucht es solche Klagen, um überhaupt einen gesetzlichen Rahmen zu schaffen. 🤔
이 뉴스 보니까 생각이 좀 복잡해지네요. AI가 학습하는 과정에서 저작권 문제가 계속 불거지는군요. 실버먼 작가분들 소송이 어떻게 될지 궁금하긴 한데, 결국 법원 판단에 달린 문제 같아요. AI 발전을 위해선 데이터 접근이 필요하지만 창작자의 권리도 분명히 보호돼야 하고... 🤔 앞으로 이런 논쟁이 더 많아질 텐데, 관련 법이 빨리 정립됐으면 좋겠어요.
GPTの学習データってやっぱり著作権が問題になるよねー。この訴訟、どう転ぶか気になります。AI進化には大量のデータが必須だけど、クリエイターの権利もきちんと守れる仕組みが必要だな。勝敗が今後の生成AIビジネスに大きな影響を与えそう。
This lawsuit is wild! 😮 I mean, authors like Sarah Silverman going after Meta and OpenAI for copyright? That’s a bold move. Makes me wonder if AI’s just gobbling up books like a kid with candy. Hope this sparks a bigger chat about ethics in tech!
This lawsuit is wild! 😮 Silverman and others taking on Meta and OpenAI for copyright issues? I’m curious how this plays out—could set a big precedent for AI and creativity!
Sarah Silverman et ses co-auteurs intentent une action en justice contre Meta et OpenAI
Sarah Silverman, ainsi que les auteurs Richard Kadfrey et Christopher Golden, ont engagé des poursuites judiciaires contre Meta et OpenAI, accusant les deux géants technologiques de violation du droit d'auteur. Les auteurs allèguent que leurs livres protégés par le droit d'auteur ont été utilisés sans leur consentement pour entraîner les grands modèles de langage (LLMs) alimentant ChatGPT d'OpenAI et LLaMa de Meta.
Les poursuites sont distinctes, chacune visant l'une des entreprises. Le cœur de leur argumentation est que leurs œuvres ont été incorporées dans les ensembles de données d'entraînement de ces LLMs, ce qu'ils considèrent comme une utilisation non autorisée de leur matériel.
Comprendre les grands modèles de langage
Un LLM est un algorithme d'IA avancé qui apprend à partir de vastes quantités de données textuelles, y compris des livres et du contenu internet. Cet entraînement permet au modèle de comprendre les schémas linguistiques, la grammaire et le contexte, lui permettant finalement de générer du texte imitant l'écriture humaine et de s'engager dans des interactions conversationnelles avec les utilisateurs.
Les poursuites soutiennent que ces modèles "remixent" essentiellement le matériel protégé par le droit d'auteur de milliers d'auteurs sans leur permission, compensation ou reconnaissance.
Le contexte plus large de l'IA et du droit d'auteur
La question de la violation du droit d'auteur est devenue une préoccupation majeure depuis l'apparition de ChatGPT, qui a déclenché une montée en puissance des technologies d'IA générative. Cela a soulevé des questions sur l'impact de l'IA sur la créativité et le processus de droit d'auteur.
Les poursuites affirment que les LLMs ont été entraînés à l'aide de matériels obtenus illégalement, tels que ceux trouvés sur des sites de "bibliothèques fantômes". La poursuite contre OpenAI mentionne spécifiquement l'ensemble de données "OpenAI Books2", qui inclurait environ 294 000 titres provenant de sites notoires comme Library Genesis, Z-Library, Sci-Hub et Bibliotik, accessibles via des systèmes de torrent.
De manière similaire, la poursuite contre Meta pointe deux sources pour leurs données d'entraînement : Project Gutenberg, une archive de livres qui ne sont plus sous droit d'auteur, et la "section Books3 de l'ensemble de données ThePile" sur Hugging Face, qui semble englober l'ensemble de la collection Bibliotik.
Représentation légale et affaires connexes
Sarah Silverman et ses co-plaignants sont représentés par les avocats Joseph Savery et Matthew Butterick. Ces mêmes avocats gèrent également une poursuite distincte déposée en juin contre OpenAI par les auteurs Mona Awad et Paul Tremblay, également pour des allégations de violation du droit d'auteur.
Les batailles juridiques en cours mettent en lumière la tension entre le développement de l'IA et les droits des créateurs de contenu, un sujet qui continue d'évoluer à mesure que la technologie de l'IA progresse.
Comprendre la nouvelle norme ETSI en matière de sécurité de l'IA
La norme ETSI EN 304 223 définit les exigences fondamentales en matière de sécurité pour l'intelligence artificielle que les organisations doivent intégrer dans leurs structures de gouvernance.Alors q
Gmail lance une boîte de réception personnalisée grâce à l'IA, des aperçus générés par l'IA dans la recherche, et bien plus encore
Google a lancé une nouvelle boîte de réception alimentée par l'IA pour Gmail, qui vous offre un aperçu personnalisé de vos tâches et vous tient informé des mises à jour importantes. Parallèlement, Gma
La première base de création de séries animées par IA de Baidu dans la province du Shandong voit le jour à Zibo
Le 27 avril, la province du Shandong a franchi une étape importante dans le domaine de la création culturelle numérique avec le lancement officiel de sa première base de création de séries animées bas
Sarah Silverman mit einem Rechtsstreit gegen Tech-Giganten ist eine mutige, aber vielleicht aussichtslose Sache. KI-Trainingsdaten und Urheberrecht — das wird noch jahrelang juristische Diskussionen füttern. Irgendwie wirkt es wie David gegen Goliath, aber dieses Mal haben die Goliaths Zugriff auf nahezu alle digitalisierten Bücher der Welt. Vielleicht braucht es solche Klagen, um überhaupt einen gesetzlichen Rahmen zu schaffen. 🤔
이 뉴스 보니까 생각이 좀 복잡해지네요. AI가 학습하는 과정에서 저작권 문제가 계속 불거지는군요. 실버먼 작가분들 소송이 어떻게 될지 궁금하긴 한데, 결국 법원 판단에 달린 문제 같아요. AI 발전을 위해선 데이터 접근이 필요하지만 창작자의 권리도 분명히 보호돼야 하고... 🤔 앞으로 이런 논쟁이 더 많아질 텐데, 관련 법이 빨리 정립됐으면 좋겠어요.
GPTの学習データってやっぱり著作権が問題になるよねー。この訴訟、どう転ぶか気になります。AI進化には大量のデータが必須だけど、クリエイターの権利もきちんと守れる仕組みが必要だな。勝敗が今後の生成AIビジネスに大きな影響を与えそう。
This lawsuit is wild! 😮 I mean, authors like Sarah Silverman going after Meta and OpenAI for copyright? That’s a bold move. Makes me wonder if AI’s just gobbling up books like a kid with candy. Hope this sparks a bigger chat about ethics in tech!
This lawsuit is wild! 😮 Silverman and others taking on Meta and OpenAI for copyright issues? I’m curious how this plays out—could set a big precedent for AI and creativity!





Maison






