選項
首頁 消息 研究人員聲稱

研究人員聲稱

發布日期 發布日期 2025年04月07日
作者 作者 JuanThomas
視圖 視圖 94

研究人員聲稱

Openai未經允許培訓其AI模型,面臨著眾多使用受版權保護的材料的指控。 AI披露項目的最新研究是由媒體大亨蒂姆·奧萊利(Tim O'Reilly)和經濟學家伊蘭·斯特勞斯(Ilan Strauss)於2024年成立的非營利組織,這表明Openai可能使用O'Reilly Media的非公開書籍來培訓其更高級的模型GPT-4O。 AI模型,本質上是複雜的預測引擎,在包括書籍,電影和電視節目在內的大量數據集上進行了培訓。他們學習模式並根據這些模式產生響應,而不是創造任何真正的新事物,而是從他們廣泛的知識庫中近似。隨著像公共網絡這樣的現實數據源變得筋疲力盡,包括OpenAI在內的一些AI實驗室已經開始使用AI生成的數據進行培訓,儘管由於降低模型性能的風險,很少有人完全放棄了現實世界中的數據。 AI披露項目的論文聲稱,與較早的GPT-3.5 Turbo Model不同,OpenAI的GPT-4O模型是CHATGPT中的默認模型,顯示了對Paywalled O'Reilly Books的內容的強烈認可。該論文表明,儘管O'Reilly Media沒有與OpenAI達成許可協議,但GPT-4O可能接受了這些非公共書籍的培訓。該研究採用了一種名為DE-COP的方法,該方法於2024年引入,以檢測AI培訓數據中受版權保護的內容。這種“成員推理攻擊”測試了模型是否可以區分人類作者的文本和AI生成的釋義,這表明文本可靠地了解文本。研究人員使用34本O'Reilly書籍中的13,962段摘錄測試了GPT-4O,GPT-3.5 Turbo和其他OpenAI模型,發現GPT-4O與較舊模型相比,GPT-4O認識到的收費內容要多得多。雖然作者承認他們的方法不是萬無一失,並且用戶複製並粘貼到chatgpt中可能引入了付費內容,但這些發現引發了有關OpenAI數據實踐的疑問。該研究沒有評估OpenAI的最新模型,例如GPT-4.5和O3-Mini和O1等推理模型,因此打開了可能未接受相同數據培訓的可能性。 Openai一直在推動有關AI培訓數據的更輕鬆的版權法,並一直在尋求更高質量的數據源。該公司甚至僱用了記者來完善其模型的產出,這是在AI行業看到的這種做法,在該行業中,招募了各個領域的專家以增強AI系統。 OpenAI確實為其某些培訓數據付費,與各種內容提供商達成許可協議,並為版權所有者提供退出機制。但是,由於該公司在其數據實踐方面面臨法律挑戰,因此O'Reilly Paper的發現對其運營產生了陰影。 Openai沒有回應對該研究發表評論的請求。
相關文章
Google検索では、複雑なマルチパートクエリ用に「AIモード」が導入されています Google検索では、複雑なマルチパートクエリ用に「AIモード」が導入されています Googleは「AIモード」を検索して、Prplexity AIとChatGptgoogleに対抗し、AIアリーナでゲームを強化し、検索エンジンで実験的な「AIモード」機能を開始します。 Perplexity AIやOpenaiのChatGPT検索などを引き受けることを目的としたこの新しいモードは、水で発表されました
chatgptのユーザー名の未承諾の使用は、一部の人の間で「不気味な」懸念を引き起こします chatgptのユーザー名の未承諾の使用は、一部の人の間で「不気味な」懸念を引き起こします ChatGPTの一部のユーザーは最近、奇妙な新機能に遭遇しました。チャットボットは、問題を乗り越えながら名前を使用することがあります。これは以前の通常の動作の一部ではなく、多くのユーザーがChatGptが何を呼ぶかを言わずに自分の名前に言及すると報告しています。意見
OpenaiはChatGptを強化して、以前の会話を思い出します OpenaiはChatGptを強化して、以前の会話を思い出します Openaiは木曜日に、「Memory」と呼ばれるChatGptの新鮮な機能を展開することについて大きな発表を行いました。この気の利いたツールは、以前に話したことを思い出すことにより、AIとのチャットをよりパーソナライズするように設計されています。あなたが新しい詐欺を始めるたびに自分自身を繰り返す必要がないと想像してください
評論 (40)
0/200
RoyPerez
RoyPerez 2025年04月11日 04:31:26

So, OpenAI's AI got trained on paywalled books? That's a bit shady, isn't it? I mean, I love the tech, but using copyrighted material without permission? Come on, OpenAI, you can do better than that. Maybe they should focus on creating their own content instead.

KeithGonzález
KeithGonzález 2025年04月10日 19:27:39

オープンAIのAIが有料の本で訓練されたって?ちょっと怪しいよね?技術は好きだけど、許可なく著作権物を使うなんて。オープンAI、もっとできるはずだよ。自分のコンテンツを作ることに集中すべきだね。

MatthewHill
MatthewHill 2025年04月07日 19:28:56

오픈AI의 AI가 유료 책으로 훈련되었다고요? 좀 수상하죠? 기술은 좋아하지만, 허락 없이 저작권이 있는 자료를 사용하다니요. 오픈AI, 더 잘할 수 있어요. 자신의 콘텐츠를 만드는 데 집중해야 해요.

BenWalker
BenWalker 2025年04月09日 13:31:14

Então, a IA da OpenAI foi treinada com livros pagos? Isso é um pouco suspeito, não é? Eu gosto da tecnologia, mas usar material com direitos autorais sem permissão? Vamos, OpenAI, você pode fazer melhor do que isso. Talvez eles deveriam se concentrar em criar seu próprio conteúdo.

FrankMartínez
FrankMartínez 2025年04月09日 10:03:15

¿Así que la IA de OpenAI fue entrenada con libros de pago? Eso es un poco sospechoso, ¿no? Me gusta la tecnología, pero usar material con derechos de autor sin permiso... Vamos, OpenAI, puedes hacerlo mejor. Tal vez deberían centrarse en crear su propio contenido.

LarryHernández
LarryHernández 2025年04月10日 06:32:40

I'm torn about OpenAI using O’Reilly books to train their AI. On one hand, it's impressive how advanced their models are getting. On the other, it feels a bit shady to use paywalled content. I guess innovation sometimes walks a fine line, huh? Maybe they should just pay for the books next time!

回到頂部
OR