opção
Lar
Notícias
A IA da Openai treinou em livros de O'Reilly de paredes pagas, os pesquisadores afirmam

A IA da Openai treinou em livros de O'Reilly de paredes pagas, os pesquisadores afirmam

7 de Abril de 2025
217

A IA da Openai treinou em livros de O'Reilly de paredes pagas, os pesquisadores afirmam

O Openai enfrentou inúmeras acusações de uso de material protegido por direitos autorais sem permissão para treinar seus modelos de IA. Um estudo recente do projeto de divulgações de IA, uma organização sem fins lucrativos criada em 2024 pelo magnata da mídia Tim O'Reilly e o economista Ilan Strauss, sugere que o Openai pode ter usado livros não públicos da O'Reilly Media para treinar seu modelo mais avançado, GPT-4O. Os modelos de IA, essencialmente sofisticados mecanismos de previsão, são treinados em vastos conjuntos de dados, incluindo livros, filmes e programas de TV. Eles aprendem padrões e geram respostas com base nesses padrões, não criando nada verdadeiramente novo, mas aproximando -se de sua extensa base de conhecimento. À medida que fontes de dados do mundo real como a rede pública se esgotam, alguns laboratórios de IA, incluindo o OpenAI, começaram a usar dados gerados pela IA para treinamento, embora poucos tenham abandonado completamente dados do mundo real devido aos riscos de degradação do desempenho do modelo. O artigo do Projeto AI divulga a reivindica que o modelo GPT-4O da OpenAI, que é o padrão no ChatGPT, mostra um forte reconhecimento do conteúdo dos livros de O'Reilly de O'Reilly, ao contrário do modelo turbo GPT-3.5 anterior. O artigo sugere que o GPT-4O provavelmente foi treinado nesses livros não públicos, apesar de a O'Reilly Media não ter um contrato de licenciamento com o OpenAI. O estudo empregou um método chamado De-Cop, introduzido em 2024, para detectar conteúdo protegido por direitos autorais nos dados de treinamento de IA. Esse "ataque de inferência de associação" testa se um modelo pode distinguir entre textos com autoria humana e paráfrases geradas pela IA, indicando conhecimento prévio do texto, se puder fazê-lo de maneira confiável. Os pesquisadores testaram os modelos GPT-4O, GPT-3.5 Turbo e outros Openai usando 13.962 trechos de parágrafos de 34 livros de O'Reilly, descobrindo que o GPT-4O reconheceu significativamente mais conteúdo de paredes pagas do que os modelos mais antigos. Embora os autores reconheçam que seu método não é à prova de falhas e que o conteúdo de paredes pagas pode ter sido introduzido pelos usuários copiando e colando no ChatGPT, as descobertas levantam questões sobre as práticas de dados do OpenAI. O estudo não avaliou os modelos mais recentes do OpenAI, como GPT-4.5 e modelos de raciocínio como O3-mini e O1, deixando em aberto a possibilidade de que eles possam não ter sido treinados nos mesmos dados. O OpenAI tem pressionado por leis de direitos autorais mais relaxadas sobre dados de treinamento de IA e vem buscando fontes de dados de alta qualidade. A empresa até contratou jornalistas para refinar os resultados de seus modelos, uma prática vista em todo o setor de IA, onde especialistas em vários campos são recrutados para aprimorar os sistemas de IA. A OpenAI paga alguns de seus dados de treinamento, com acordos de licenciamento com vários provedores de conteúdo e oferecendo mecanismos de exclusão para proprietários de direitos autorais. No entanto, à medida que a empresa enfrenta desafios legais sobre suas práticas de dados, as conclusões do artigo O'Reilly lançaram uma sombra sobre suas operações. O Openai não respondeu aos pedidos de comentário sobre o estudo.
Artigo relacionado
A OpenAI adquiriu a startup de finanças pessoais baseada em inteligência artificial Hiro. A OpenAI adquiriu a startup de finanças pessoais baseada em inteligência artificial Hiro. A OpenAI adquiriu a startup de finanças pessoais Hiro Finance, anunciou o fundador Ethan Bloch na segunda-feira, e a OpenAI confirmou a transação ao TechCrunch. A startup contava com o apoio da importante empresa de capital de risco em fintech Ribbit
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Recomendações de tópicos especiais relacionados
Criação de vídeo Os melhores criadores de vídeo com IA para podcasters: transforme arquivos de áudio em vídeos envolventes com apresentador
Os melhores criadores de vídeo com IA para podcasters: transforme arquivos de áudio em vídeos envolventes com apresentador

Descubra os melhores criadores de vídeo com IA para podcasters de 2026 no XIX.AI. Nossa lista selecionada e com as melhores avaliações apresenta ferramentas poderosas que transformam seu áudio em vídeos envolventes com a sua imagem em primeiro plano, sem esforço. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Destaque-se agora na narrativa visual.

10 ferramentas
xix.ai
chatbot Crie sua própria história de amor com IA usando estas ferramentas de roleplay
Crie sua própria história de amor com IA usando estas ferramentas de roleplay

Descubra as melhores ferramentas de roleplay com IA de 2026 para criar narrativas imersivas. A lista selecionada pela XIX.AI apresenta assistentes poderosos e revolucionários, capazes de estimular a narrativa criativa e a profundidade emocional. Compare as opções gratuitas com as pagas por meio de testes práticos. Comece hoje mesmo sua jornada única.

10 ferramentas
xix.ai
Conversão de texto para fala As melhores ferramentas de voz com IA para desenvolvedores de jogos independentes: economize tempo na dublagem de RPGs e romances visuais
As melhores ferramentas de voz com IA para desenvolvedores de jogos independentes: economize tempo na dublagem de RPGs e romances visuais

Descubra as melhores ferramentas de voz com IA de 2026 para desenvolvedores de jogos! A lista selecionada pela XIX.AI apresenta soluções de ponta e revolucionárias para economizar seu tempo e dinheiro na dublagem de RPGs e romances visuais. Explore comparações entre opções gratuitas e pagas, testes práticos e rankings atualizados semanalmente. Encontre hoje a ferramenta de voz perfeita para você!

10 ferramentas
xix.ai
Educação e Aprendizagem Melhores ferramentas de repetição espaçada com IA: otimize seus horários de estudo para estudantes de medicina e direito
Melhores ferramentas de repetição espaçada com IA: otimize seus horários de estudo para estudantes de medicina e direito

Descubra os melhores ferramentas de repetição espaçada em AI de 2026, selecionadas por XIX.AI. Nossas escolhas mais recomendadas e revolucionárias ajudam estudantes de medicina e direito a otimizar seus horários de estudo para uma melhor retenção do conhecimento. Compare opções gratuitas e pagas com testes reais e rankings atualizados semanalmente. Desfrute agora de uma vantagem competitiva no aprendizado.

10 ferramentas
xix.ai
Criação de vídeo As melhores plataformas de IA para conversão de texto em vídeo para redação de roteiros e narrativa visual
As melhores plataformas de IA para conversão de texto em vídeo para redação de roteiros e narrativa visual

As melhores plataformas de IA para conversão de texto em vídeo de 2026: as ferramentas mais bem avaliadas para redação de roteiros e narrativa visual. Descubra soluções poderosas e revolucionárias para transformar seu texto em vídeos envolventes. Compare opções gratuitas e pagas com nossos rankings atualizados semanalmente e testes práticos. Encontre a plataforma perfeita para impulsionar sua criatividade e produtividade. Explore a seleção especial no XIX.AI.

10 ferramentas
xix.ai
chatbot Orquestradores de Múltiplos Agentes IA: Projeto de Fluxos de Trabalho Automatizados Complexos através do Linguagem Natural
Orquestradores de Múltiplos Agentes IA: Projeto de Fluxos de Trabalho Automatizados Complexos através do Linguagem Natural

2026 Mais recente: Descubra os melhores orquestradores multi-agente de IA para projetar fluxos de trabalho automatizados complexos através do uso da linguagem natural. Nossa lista selecionada apresenta plataformas poderosas e altamente avaliadas para uma automação de tarefas sem falhas e um gerenciamento inteligente de processos. Compare opções gratuitas e pagas com informações reais do mundo real. Desfrute de uma vantagem competitiva com as classificações atualizadas semanalmente por especialistas da XIX.AI.

10 ferramentas
xix.ai
Comentários (42)
0/500
RichardJackson
RichardJackson 16 de Novembro de 2025 à37 14:30:37 WET

こんなことされてしまうと、著作権料を払って制作している出版社側はたまったもんじゃないよね…AIの学習データの透明性、もっと求められるべきだと思う。🤔

PeterNelson
PeterNelson 31 de Julho de 2025 à39 12:35:39 WEST

This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅

HarperJones
HarperJones 23 de Abril de 2025 à27 03:24:27 WEST

OpenAI가 유료 책을 이용해 AI를 훈련했다니 좀 의심스럽네요. 한편으론 AI 성능이 인상적이지만, 데이터 소스를 더 나은 방법으로 찾아야 할 것 같아요. 🤔

WalterWhite
WalterWhite 18 de Abril de 2025 à48 20:33:48 WEST

OpenAIの件については少し悩んでいます。O’Reillyの本を無断で使うのはちょっと気持ち悪いですが、彼らが作っているAIはかなりクールですね。次回は本の使用料を払うべきかも?🤔

BruceClark
BruceClark 18 de Abril de 2025 à34 03:02:34 WEST

OpenAIが有料の書籍を使ってAIを訓練しているのは少し問題があるかもしれません。でも、AIの性能は本当に素晴らしいですね。データのソースをより良い方法で見つける必要があると思います。🤔

DennisGarcia
DennisGarcia 18 de Abril de 2025 à35 02:58:35 WEST

I'm kinda torn about this OpenAI thing. On one hand, using those O’Reilly books without permission feels a bit off, you know? But on the other hand, the AI they're building is pretty slick! Maybe they should just pay for the books next time? 🤔

OR