Os autores procuram o OpenAi e Meta por suposta violação de direitos autorais
Sarah Silverman e Coautores Tomam Ação Legal Contra Meta e OpenAI
Sarah Silverman, juntamente com os autores Richard Kadfrey e Christopher Golden, iniciaram processos judiciais contra Meta e OpenAI, acusando ambas as gigantes da tecnologia de violação de direitos autorais. Os autores alegam que seus livros protegidos por direitos autorais foram usados sem seu consentimento para treinar os modelos de linguagem de grande escala (LLMs) que alimentam o ChatGPT da OpenAI e o LLaMa da Meta.
Os processos são distintos, cada um direcionado a uma das empresas. O cerne de seu argumento é que suas obras foram incorporadas aos conjuntos de dados de treinamento desses LLMs, o que eles afirmam ser uma utilização não autorizada de seu material.
Entendendo os Modelos de Linguagem de Grande Escala
Um LLM é um algoritmo de IA avançado que aprende a partir de vastas quantidades de dados de texto, incluindo livros e conteúdo da internet. Esse treinamento permite que o modelo compreenda padrões de linguagem, gramática e contexto, possibilitando, em última análise, a geração de textos que imitam a escrita humana e a interação em conversas com usuários.
Os processos alegam que esses modelos essencialmente "remixam" o material protegido por direitos autorais de milhares de autores sem sua permissão, compensação ou reconhecimento.
O Contexto Mais Amplo de IA e Direitos Autorais
A questão da violação de direitos autorais tornou-se uma preocupação significativa desde o surgimento do ChatGPT, que desencadeou um aumento nas tecnologias de IA generativa. Isso levantou questões sobre o impacto da IA na criatividade e no processo de direitos autorais.
Os processos afirmam que os LLMs foram treinados usando materiais obtidos ilegalmente, como aqueles encontrados em sites de "bibliotecas sombras". O processo contra a OpenAI menciona especificamente o "OpenAI Books2 dataset", que se acredita incluir cerca de 294.000 títulos provenientes de sites notórios como Library Genesis, Z-Library, Sci-Hub e Bibliotik, acessíveis por sistemas de torrent.
Da mesma forma, o processo contra a Meta aponta duas fontes para seus dados de treinamento: o Project Gutenberg, um arquivo de livros que não estão mais sob direitos autorais, e a "seção Books3 do ThePile" no Hugging Face, que parece englobar toda a coleção Bibliotik.
Representação Legal e Casos Relacionados
Sarah Silverman e seus colegas demandantes são representados pelos advogados Joseph Savery e Matthew Butterick. Esses mesmos advogados também estão lidando com um processo separado movido em junho contra a OpenAI pelos autores Mona Awad e Paul Tremblay, também por suposta violação de direitos autorais.

As batalhas legais em andamento destacam a tensão entre o desenvolvimento de IA e os direitos dos criadores de conteúdo, um tema que continua a evoluir à medida que a tecnologia de IA avança.
Artigo relacionado
O Gmail lança uma Caixa de Entrada personalizada com IA, resumos com IA na pesquisa e muito mais
O Google lançou uma nova caixa de entrada do Gmail com tecnologia de IA que oferece uma visão geral personalizada das suas tarefas e mantém você informado sobre as principais atualizações. Além disso,
Primeira Base de Criação de Séries de Quadrinhos com IA do Baidu em Shandong é inaugurada em Zibo
Em 27 de abril, a província de Shandong alcançou um marco na criação cultural digital com o lançamento oficial de sua primeira base de criação de séries de quadrinhos com IA da Baidu na Faculdade Norm
Sandberg e Clegg ingressam no conselho da Nscale enquanto a startup "Stargate Norway" atinge uma avaliação de US$ 14,6 bilhões
À medida que cresce a demanda por data centers capazes de fornecer computação de IA em grande escala, a Nscale, uma empresa britânica de infraestrutura de IA apoiada pela Nvidia, atingiu uma avaliação
Recomendações de tópicos especiais relacionados
Comentários (20)
Sarah Silverman mit einem Rechtsstreit gegen Tech-Giganten ist eine mutige, aber vielleicht aussichtslose Sache. KI-Trainingsdaten und Urheberrecht — das wird noch jahrelang juristische Diskussionen füttern. Irgendwie wirkt es wie David gegen Goliath, aber dieses Mal haben die Goliaths Zugriff auf nahezu alle digitalisierten Bücher der Welt. Vielleicht braucht es solche Klagen, um überhaupt einen gesetzlichen Rahmen zu schaffen. 🤔
이 뉴스 보니까 생각이 좀 복잡해지네요. AI가 학습하는 과정에서 저작권 문제가 계속 불거지는군요. 실버먼 작가분들 소송이 어떻게 될지 궁금하긴 한데, 결국 법원 판단에 달린 문제 같아요. AI 발전을 위해선 데이터 접근이 필요하지만 창작자의 권리도 분명히 보호돼야 하고... 🤔 앞으로 이런 논쟁이 더 많아질 텐데, 관련 법이 빨리 정립됐으면 좋겠어요.
GPTの学習データってやっぱり著作権が問題になるよねー。この訴訟、どう転ぶか気になります。AI進化には大量のデータが必須だけど、クリエイターの権利もきちんと守れる仕組みが必要だな。勝敗が今後の生成AIビジネスに大きな影響を与えそう。
This lawsuit is wild! 😮 I mean, authors like Sarah Silverman going after Meta and OpenAI for copyright? That’s a bold move. Makes me wonder if AI’s just gobbling up books like a kid with candy. Hope this sparks a bigger chat about ethics in tech!
This lawsuit is wild! 😮 Silverman and others taking on Meta and OpenAI for copyright issues? I’m curious how this plays out—could set a big precedent for AI and creativity!
Sarah Silverman e Coautores Tomam Ação Legal Contra Meta e OpenAI
Sarah Silverman, juntamente com os autores Richard Kadfrey e Christopher Golden, iniciaram processos judiciais contra Meta e OpenAI, acusando ambas as gigantes da tecnologia de violação de direitos autorais. Os autores alegam que seus livros protegidos por direitos autorais foram usados sem seu consentimento para treinar os modelos de linguagem de grande escala (LLMs) que alimentam o ChatGPT da OpenAI e o LLaMa da Meta.
Os processos são distintos, cada um direcionado a uma das empresas. O cerne de seu argumento é que suas obras foram incorporadas aos conjuntos de dados de treinamento desses LLMs, o que eles afirmam ser uma utilização não autorizada de seu material.
Entendendo os Modelos de Linguagem de Grande Escala
Um LLM é um algoritmo de IA avançado que aprende a partir de vastas quantidades de dados de texto, incluindo livros e conteúdo da internet. Esse treinamento permite que o modelo compreenda padrões de linguagem, gramática e contexto, possibilitando, em última análise, a geração de textos que imitam a escrita humana e a interação em conversas com usuários.
Os processos alegam que esses modelos essencialmente "remixam" o material protegido por direitos autorais de milhares de autores sem sua permissão, compensação ou reconhecimento.
O Contexto Mais Amplo de IA e Direitos Autorais
A questão da violação de direitos autorais tornou-se uma preocupação significativa desde o surgimento do ChatGPT, que desencadeou um aumento nas tecnologias de IA generativa. Isso levantou questões sobre o impacto da IA na criatividade e no processo de direitos autorais.
Os processos afirmam que os LLMs foram treinados usando materiais obtidos ilegalmente, como aqueles encontrados em sites de "bibliotecas sombras". O processo contra a OpenAI menciona especificamente o "OpenAI Books2 dataset", que se acredita incluir cerca de 294.000 títulos provenientes de sites notórios como Library Genesis, Z-Library, Sci-Hub e Bibliotik, acessíveis por sistemas de torrent.
Da mesma forma, o processo contra a Meta aponta duas fontes para seus dados de treinamento: o Project Gutenberg, um arquivo de livros que não estão mais sob direitos autorais, e a "seção Books3 do ThePile" no Hugging Face, que parece englobar toda a coleção Bibliotik.
Representação Legal e Casos Relacionados
Sarah Silverman e seus colegas demandantes são representados pelos advogados Joseph Savery e Matthew Butterick. Esses mesmos advogados também estão lidando com um processo separado movido em junho contra a OpenAI pelos autores Mona Awad e Paul Tremblay, também por suposta violação de direitos autorais.
As batalhas legais em andamento destacam a tensão entre o desenvolvimento de IA e os direitos dos criadores de conteúdo, um tema que continua a evoluir à medida que a tecnologia de IA avança.
O Gmail lança uma Caixa de Entrada personalizada com IA, resumos com IA na pesquisa e muito mais
O Google lançou uma nova caixa de entrada do Gmail com tecnologia de IA que oferece uma visão geral personalizada das suas tarefas e mantém você informado sobre as principais atualizações. Além disso,
Primeira Base de Criação de Séries de Quadrinhos com IA do Baidu em Shandong é inaugurada em Zibo
Em 27 de abril, a província de Shandong alcançou um marco na criação cultural digital com o lançamento oficial de sua primeira base de criação de séries de quadrinhos com IA da Baidu na Faculdade Norm
Sandberg e Clegg ingressam no conselho da Nscale enquanto a startup "Stargate Norway" atinge uma avaliação de US$ 14,6 bilhões
À medida que cresce a demanda por data centers capazes de fornecer computação de IA em grande escala, a Nscale, uma empresa britânica de infraestrutura de IA apoiada pela Nvidia, atingiu uma avaliação
Sarah Silverman mit einem Rechtsstreit gegen Tech-Giganten ist eine mutige, aber vielleicht aussichtslose Sache. KI-Trainingsdaten und Urheberrecht — das wird noch jahrelang juristische Diskussionen füttern. Irgendwie wirkt es wie David gegen Goliath, aber dieses Mal haben die Goliaths Zugriff auf nahezu alle digitalisierten Bücher der Welt. Vielleicht braucht es solche Klagen, um überhaupt einen gesetzlichen Rahmen zu schaffen. 🤔
이 뉴스 보니까 생각이 좀 복잡해지네요. AI가 학습하는 과정에서 저작권 문제가 계속 불거지는군요. 실버먼 작가분들 소송이 어떻게 될지 궁금하긴 한데, 결국 법원 판단에 달린 문제 같아요. AI 발전을 위해선 데이터 접근이 필요하지만 창작자의 권리도 분명히 보호돼야 하고... 🤔 앞으로 이런 논쟁이 더 많아질 텐데, 관련 법이 빨리 정립됐으면 좋겠어요.
GPTの学習データってやっぱり著作権が問題になるよねー。この訴訟、どう転ぶか気になります。AI進化には大量のデータが必須だけど、クリエイターの権利もきちんと守れる仕組みが必要だな。勝敗が今後の生成AIビジネスに大きな影響を与えそう。
This lawsuit is wild! 😮 I mean, authors like Sarah Silverman going after Meta and OpenAI for copyright? That’s a bold move. Makes me wonder if AI’s just gobbling up books like a kid with candy. Hope this sparks a bigger chat about ethics in tech!
This lawsuit is wild! 😮 Silverman and others taking on Meta and OpenAI for copyright issues? I’m curious how this plays out—could set a big precedent for AI and creativity!





Lar






