选项
首页 新闻 研究人员声称

研究人员声称

发布日期 发布日期 2025年04月07日
作者 作者 JuanThomas
浏览量 浏览量 94

研究人员声称

Openai未经允许培训其AI模型,面临着众多使用受版权保护的材料的指控。 AI披露项目的最新研究是由媒体大亨蒂姆·奥莱利(Tim O'Reilly)和经济学家伊兰·斯特劳斯(Ilan Strauss)于2024年成立的非营利组织,这表明Openai可能使用O'Reilly Media的非公开书籍来培训其更高级的模型GPT-4O。 AI模型,本质上是复杂的预测引擎,在包括书籍,电影和电视节目在内的大量数据集上进行了培训。他们学习模式并根据这些模式产生响应,而不是创造任何真正的新事物,而是从他们广泛的知识库中近似。随着像公共网络这样的现实数据源变得筋疲力尽,包括OpenAI在内的一些AI实验室已经开始使用AI生成的数据进行培训,尽管由于降低模型性能的风险,很少有人完全放弃了现实世界中的数据。 AI披露项目的论文声称,与较早的GPT-3.5 Turbo Model不同,OpenAI的GPT-4O模型是CHATGPT中的默认模型,显示了对Paywalled O'Reilly Books的内容的强烈认可。该论文表明,尽管O'Reilly Media没有与OpenAI达成许可协议,但GPT-4O可能接受了这些非公共书籍的培训。该研究采用了一种名为DE-COP的方法,该方法于2024年引入,以检测AI培训数据中受版权保护的内容。这种“成员推理攻击”测试了模型是否可以区分人类作者的文本和AI生成的释义,这表明文本可靠地了解文本。研究人员使用34本O'Reilly书籍中的13,962段摘录测试了GPT-4O,GPT-3.5 Turbo和其他OpenAI模型,发现GPT-4O与较旧模型相比,GPT-4O认识到的收费内容要多得多。虽然作者承认他们的方法不是万无一失,并且用户复制并粘贴到chatgpt中可能引入了付费内容,但这些发现引发了有关OpenAI数据实践的疑问。该研究没有评估OpenAI的最新模型,例如GPT-4.5和O3-Mini和O1等推理模型,因此打开了可能未接受相同数据培训的可能性。 Openai一直在推动有关AI培训数据的更轻松的版权法,并一直在寻求更高质量的数据源。该公司甚至雇用了记者来完善其模型的产出,这是在AI行业看到的这种做法,在该行业中,招募了各个领域的专家以增强AI系统。 OpenAI确实为其某些培训数据付费,与各种内容提供商达成许可协议,并为版权所有者提供退出机制。但是,由于该公司在其数据实践方面面临法律挑战,因此O'Reilly Paper的发现对其运营产生了阴影。 Openai没有回应对该研究发表评论的请求。
相关文章
Google検索では、複雑なマルチパートクエリ用に「AIモード」が導入されています Google検索では、複雑なマルチパートクエリ用に「AIモード」が導入されています Googleは「AIモード」を検索して、Prplexity AIとChatGptgoogleに対抗し、AIアリーナでゲームを強化し、検索エンジンで実験的な「AIモード」機能を開始します。 Perplexity AIやOpenaiのChatGPT検索などを引き受けることを目的としたこの新しいモードは、水で発表されました
chatgptのユーザー名の未承諾の使用は、一部の人の間で「不気味な」懸念を引き起こします chatgptのユーザー名の未承諾の使用は、一部の人の間で「不気味な」懸念を引き起こします ChatGPTの一部のユーザーは最近、奇妙な新機能に遭遇しました。チャットボットは、問題を乗り越えながら名前を使用することがあります。これは以前の通常の動作の一部ではなく、多くのユーザーがChatGptが何を呼ぶかを言わずに自分の名前に言及すると報告しています。意見
OpenaiはChatGptを強化して、以前の会話を思い出します OpenaiはChatGptを強化して、以前の会話を思い出します Openaiは木曜日に、「Memory」と呼ばれるChatGptの新鮮な機能を展開することについて大きな発表を行いました。この気の利いたツールは、以前に話したことを思い出すことにより、AIとのチャットをよりパーソナライズするように設計されています。あなたが新しい詐欺を始めるたびに自分自身を繰り返す必要がないと想像してください
评论 (40)
0/200
RoyPerez
RoyPerez 2025年04月11日 04:31:26

So, OpenAI's AI got trained on paywalled books? That's a bit shady, isn't it? I mean, I love the tech, but using copyrighted material without permission? Come on, OpenAI, you can do better than that. Maybe they should focus on creating their own content instead.

KeithGonzález
KeithGonzález 2025年04月10日 19:27:39

オープンAIのAIが有料の本で訓練されたって?ちょっと怪しいよね?技術は好きだけど、許可なく著作権物を使うなんて。オープンAI、もっとできるはずだよ。自分のコンテンツを作ることに集中すべきだね。

MatthewHill
MatthewHill 2025年04月07日 19:28:56

오픈AI의 AI가 유료 책으로 훈련되었다고요? 좀 수상하죠? 기술은 좋아하지만, 허락 없이 저작권이 있는 자료를 사용하다니요. 오픈AI, 더 잘할 수 있어요. 자신의 콘텐츠를 만드는 데 집중해야 해요.

BenWalker
BenWalker 2025年04月09日 13:31:14

Então, a IA da OpenAI foi treinada com livros pagos? Isso é um pouco suspeito, não é? Eu gosto da tecnologia, mas usar material com direitos autorais sem permissão? Vamos, OpenAI, você pode fazer melhor do que isso. Talvez eles deveriam se concentrar em criar seu próprio conteúdo.

FrankMartínez
FrankMartínez 2025年04月09日 10:03:15

¿Así que la IA de OpenAI fue entrenada con libros de pago? Eso es un poco sospechoso, ¿no? Me gusta la tecnología, pero usar material con derechos de autor sin permiso... Vamos, OpenAI, puedes hacerlo mejor. Tal vez deberían centrarse en crear su propio contenido.

LarryHernández
LarryHernández 2025年04月10日 06:32:40

I'm torn about OpenAI using O’Reilly books to train their AI. On one hand, it's impressive how advanced their models are getting. On the other, it feels a bit shady to use paywalled content. I guess innovation sometimes walks a fine line, huh? Maybe they should just pay for the books next time!

返回顶部
OR