研究者は、Paywalled O'Reillyの本で訓練されたOpenaiのAIが主張しています

家

ニュース

2025年4月7日

JuanThomas

218

# openai

研究者は、Paywalled O'Reillyの本で訓練されたOpenaiのAIが主張しています

Openaiは、AIモデルを訓練する許可なしに、著作権で保護された資料を使用しているという多くの告発に直面しています。 2024年にメディアの大御所ティムオライリーとエコノミストのイランストラウスによって設立された非営利団体であるAI Disclosures Projectによる最近の研究は、OpenaiがO'Reilly Mediaの非公開の本を使用してより高度なモデルであるGPT-4Oを訓練した可能性があることを示唆しています。基本的に洗練された予測エンジン、AIモデルは、本、映画、テレビ番組などの広大なデータセットでトレーニングされています。彼らはこれらのパターンに基づいてパターンを学び、応答を生成します。本当に新しいものを作成するのではなく、広範な知識ベースから近似しています。パブリックウェブのような実際のデータソースが使い果たされると、OpenaIを含む一部のAIラボは、モデルのパフォーマンスの低下のリスクのために実際のデータを完全に放棄したものはほとんどありませんが、トレーニングにAIに生成されたデータの使用を開始しました。 AI開示プロジェクトの論文は、CHATGPTのデフォルトであるOpenAIのGPT-4Oモデルは、以前のGPT-3.5ターボモデルとは異なり、Paywalled O'Reillyの本からのコンテンツの強力な認識を示していると主張しています。この論文は、O'Reilly MediaがOpenaiとライセンス契約を結んでいないにもかかわらず、GPT-4oがこれらの非公開の本で訓練された可能性が高いことを示唆しています。この調査では、2024年に導入されたDE-COPと呼ばれる方法を採用して、AIトレーニングデータの著作権で保護されたコンテンツを検出しました。この「メンバーシップ推論攻撃」は、モデルがヒト著作テキストとAI生成された言い換えを区別できるかどうかをテストし、テキストが確実に行うことができるかどうかを示しています。研究者は、34 O'Reillyの本からの13,962段落の抜粋を使用して、GPT-4O、GPT-3.5ターボ、およびその他のOpenAIモデルをテストし、GPT-4Oが古いモデルよりも有意にペイウォールコンテンツを認識したことを発見しました。著者は、自分の方法が絶対確実ではなく、ペイウォールされたコンテンツがChatGPTにコピーして貼り付けることによって導入された可能性があることを認めていますが、調査結果はOpenaiのデータプラクティスに関する疑問を提起します。この研究では、GPT-4.5やO3-MiniやO1などの推論モデルなどのOpenAIの最新モデルは評価されておらず、これらが同じデータで訓練されていない可能性を明らかにしています。 Openaiは、AIトレーニングデータに関するよりリラックスした著作権法を推進しており、高品質のデータソースを求めています。同社はジャーナリストを雇ってモデルの出力を改良しました。これは、AIシステムを強化するためにさまざまな分野の専門家が募集されるAI業界全体で見られる慣行です。 Openaiは、さまざまなコンテンツプロバイダーとライセンス契約を結び、著作権所有者にオプトアウトメカニズムを提供し、トレーニングデータの一部を支払います。ただし、会社がデータプラクティスをめぐる法的課題に直面しているため、O'Reilly Paperの調査結果はその運用に影を落としました。 Openaiは、調査に関するコメントの要求に応じませんでした。

OpenAI、AIを活用した個人向け金融スタートアップのHiroを買収 OpenAIが個人向け金融スタートアップのHiro Financeを買収したと、創業者のイーサン・ブロック氏が月曜日に発表し、OpenAIもTechCrunchに対してこの取引を確認した。同スタートアップは、大手フィンテック系ベンチャーキャピタルのRibbitに加え、General CatalystやRestiveからも出資を受けていた。買収条件は明らかにされておらず、Hiroも調達額を公表したこ

サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、

OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、

関連特集おすすめ

SEO

最高のAIリダイレクト機能とブロークンリンク検出ツール：クロールエラーを自動的に修復し、クロール予算を節約しましょう

XIX.AIで2026年に最も優れたAIリダイレクトツールや壊れたリンクを探すツールを発見してください。当社が厳選したこのリストには、クロールエラーを自動的に修復し、クロール予算を節約するのに役立つ強力なツールが含まれています。無料オプションと有料オプションを実際のテスト結果と毎週更新されるランキングで比較してください。今すぐ最適なSEOソリューションを見つけましょう！

10 ツール

xix.ai

動画作成

ポッドキャスター向けのおすすめAI動画作成ツール：音声データを魅力的なトーク動画に変換

XIX.AIで、ポッドキャスター向けの2026年ベストAI動画作成ツールを発見しましょう。厳選された高評価のリストには、音声データを簡単に魅力的なトークヘッド動画に変換できる強力なツールが揃っています。実際のテスト結果や毎週更新されるランキングをもとに、無料版と有料版の比較が可能です。今すぐビジュアルストーリーテリングの優位性を手に入れましょう。

10 ツール

xix.ai

チャットボット

これらのロールプレイツールで、自分だけのAIラブストーリーを作ろう

没入感のある物語を紡ぐための、2026年最新の高評価AIロールプレイツールをご紹介。XIX.AIが厳選したこのリストには、創造的なストーリーテリングと情感豊かな深みを解き放つ、強力で画期的なアシスタントが揃っています。実際のテスト結果をもとに、無料版と有料版を比較しましょう。今すぐあなただけの旅を始めましょう。

10 ツール

xix.ai

テキスト読み上げ

インディーゲーム開発者向けのおすすめAIボイスツール：RPGやビジュアルノベルのボイス収録時間を短縮

ゲーム開発者必見！2026年おすすめのAIボイスツールを紹介！XIX.AIが厳選したリストには、RPGやビジュアルノベルのボイス収録にかかる時間とコストを削減する、高評価で業界を変革するソリューションが揃っています。無料版と有料版の比較、実地テスト、毎週更新されるランキングをチェックしましょう。あなたにぴったりのボイスツールを今すぐ見つけましょう！

10 ツール

xix.ai

教育と学習

最高のAIスペースドリピートツール：医学生や法律専攻の学生のための学習スケジュール最適化

2026年に最も優れたAIを活用した反復学習ツールをXIX.AIが厳選してご紹介します。私たちが推薦するこれらの画期的なツールは、医学や法律を学ぶ学生が学習計画を最適化し、知識をより効果的に定着させるのに役立ちます。無料版と有料版を実際のテスト結果や毎週更新されるランキングをもとに比較してみてください。今すぐ学習効率を高めましょう。

10 ツール

xix.ai

動画作成

脚本作成とビジュアルストーリーテリングに最適なAIテキスト・トゥ・ビデオ・プラットフォーム

2026年最新・最高のAIテキストから動画生成プラットフォーム：脚本作成やビジュアルストーリーテリングに最適なツールをご紹介。テキストを魅力的な動画に変える、画期的なソリューションをご覧ください。毎週更新されるランキングと実地テストに基づき、無料版と有料版の比較も可能です。創造性と生産性を高める、あなたにぴったりのプラットフォームを見つけましょう。XIX.AIで厳選されたラインナップをご覧ください。

10 ツール

xix.ai

コメント (42)

0/500

最初にログインしてください

RichardJackson

2025年11月16日 23:30:37 JST

こんなことされてしまうと、著作権料を払って制作している出版社側はたまったもんじゃないよね…AIの学習データの透明性、もっと求められるべきだと思う。🤔

PeterNelson

2025年7月31日 20:35:39 JST

This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅

HarperJones

2025年4月23日 11:24:27 JST

OpenAI가 유료 책을 이용해 AI를 훈련했다니 좀 의심스럽네요. 한편으론 AI 성능이 인상적이지만, 데이터 소스를 더 나은 방법으로 찾아야 할 것 같아요. 🤔

WalterWhite

2025年4月19日 4:33:48 JST

OpenAIの件については少し悩んでいます。O’Reillyの本を無断で使うのはちょっと気持ち悪いですが、彼らが作っているAIはかなりクールですね。次回は本の使用料を払うべきかも？🤔

BruceClark

2025年4月18日 11:02:34 JST

OpenAIが有料の書籍を使ってAIを訓練しているのは少し問題があるかもしれません。でも、AIの性能は本当に素晴らしいですね。データのソースをより良い方法で見つける必要があると思います。🤔

DennisGarcia

2025年4月18日 10:58:35 JST

I'm kinda torn about this OpenAI thing. On one hand, using those O’Reilly books without permission feels a bit off, you know? But on the other hand, the AI they're building is pretty slick! Maybe they should just pay for the books next time? 🤔

トップニュース

AI BuilderとPower Automateがドキュメントの要約を革新 AIホストのNotebooklm Podcastのホストは、インタビューに利用できるようになりました中国、国家ヒューマノイドロボット及び具現化された知能の基準を発表企業のAI導入は頭打ち、ランプのデータで明らかに Bing Image Creator チュートリアル: AIアート生成ガイドあなたの声を使用してAIミュージックを作成することを学ぶ：ステップバイステップSunoチュートリアル iMyFone MagicMic：リアルタイムAIボイスチェンジャーのレビューとチュートリアル 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案エンボディッド・インテリジェンス、無秩序な拡大を抑制するための初の業界標準を発表 DeepSeek V4、マルチモーダルAIのゲームチェンジャーとして登場

もっと

特集