Исследователи утверждают, что ИИ Openai обучался на платежных книгах О'Рейли

Дом

Новости

7 апреля 2025 г.

JuanThomas

218

# openai

Исследователи утверждают, что ИИ Openai обучался на платежных книгах О'Рейли

OpenAI столкнулся с многочисленными обвинениями в использовании защищенных авторским правом материала без разрешения на обучение моделей ИИ. Недавнее исследование, проведенное проектом по раскрытию информации AI, некоммерческой организации, созданная в 2024 году медиа-магнатом Тимом О'Рейли и экономистом Илан Штраусом, предполагает, что OpenAI, возможно, использовал непубличные книги из O'Reilly Media для обучения своей более продвинутой модели GPT-4O. Модели ИИ, по существу сложные двигатели прогнозирования, обучены обширным наборам данных, включая книги, фильмы и телешоу. Они изучают шаблоны и генерируют ответы на основе этих моделей, не создают что -то действительно новое, а скорее приближаются к их обширной базе знаний. По мере того, как реальные источники данных, такие как публичная сеть, исчерпаны, некоторые лаборатории искусственного интеллекта, включая OpenAI, начали использовать сгенерированные AI данных для обучения, хотя немногие полностью отказались от реальных данных из-за риска снижения производительности модели. В документе проекта AI раскрытия утверждается, что модель GPT-4O OpenAI, которая является по умолчанию в CHATGPT, показывает сильное распознавание контента из книг «О'Рейли», в отличие от более ранней модели Turbo GPT-3.5. В документе предполагается, что GPT-4O, вероятно, обучался этим непубличным книгам, несмотря на то, что O'Reilly Media не имел лицензионного соглашения с OpenAI. В исследовании использовался метод, называемый DE-COP, введенный в 2024 году, для обнаружения защищенного авторским правом контента в данных обучения искусственного интеллекта. Эта «атака по выводу членства» проверяет, может ли модель различать тексты, авторизованные человеком и парафразы, сгенерированные AI, что указывает на предварительное знание текста, если он может сделать это надежно. Исследователи протестировали модели GPT-4O, GPT-3.5 Turbo и другие модели OpenAI, используя 13 962 выдержки абзаца из 34 книг O'Reilly, обнаружив, что GPT-4O обнаружил значительно больше контента с платной, чем более старые модели. В то время как авторы признают, что их метод не является надежным, и что контент с платной, возможно, был представлен пользователями, копирующими и вставленными в CHATGPT, результаты поднимают вопросы о практике данных OpenAI. Исследование не оценило последние модели OpenAI, такие как модели GPT-4.5 и рассуждения, такие как O3-Mini и O1, оставив открыть возможность того, что они, возможно, не были обучены тем же данным. OpenAI стремится к более расслабленным законам об авторском праве, касающихся данных обучения ИИ и ищет более качественные источники данных. Компания даже наняла журналистов, чтобы усовершенствовать результаты своих моделей, практику, которую можно увидеть в отрасли искусственного интеллекта, где эксперты в различных областях набираются для улучшения систем ИИ. OpenAI платит за некоторые из своих учебных данных, имея лицензионные соглашения с различными поставщиками контента и предлагая механизмы отказа для владельцев авторских прав. Однако, поскольку компания сталкивается с юридическими проблемами в отношении своей практики данных, результаты бумаги O'Reilly отдают тень на свою деятельность. OpenAI не ответил на запросы о прокомментировании исследования.

Связанная статья

OpenAI приобрела стартап Hiro, занимающийся разработкой решений для управления личными финансами на базе искусственного интеллекта OpenAI приобрела стартап Hiro Finance, занимающийся управлением личными финансами, о чем в понедельник сообщил его основатель Итан Блок; компания OpenAI подтвердила эту сделку изданию TechCrunch. Инве

Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы

OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых

Рекомендации по связанным специальным темам

SEO

Лучшие инструменты для поиска перенаправлений и нерабочих ссылок: автоматическое исправление ошибок при сканировании сайта для экономии ресурсов.

Откройте для себя лучшие инструменты по поиску перенаправлений и нерабочих ссылок на основе технологий ИИ в 2026 году на сайте XIX.AI. Наш список, составленный специально для вас, включает мощные программы, которые автоматически исправляют ошибки при сканировании сайтов, помогая сэкономить ресурсы. Сравните бесплатные и платные варианты с использованием реальных тестов и еженедельно обновляемых рейтингов. Найдите идеальное решение для вашего SEO-проекта прямо сейчас!

10 инструментов

xix.ai

Создание видео

Лучшие программы для создания видео с ИИ для подкастеров: превращайте аудиозаписи в увлекательные видео с говорящей головой

Откройте для себя лучшие инструменты для создания видео с ИИ для подкастеров 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке лидеров представлены мощные инструменты, которые без труда превратят ваши аудиозаписи в увлекательные видеоролики с говорящей головой. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Откройте для себя преимущества визуального повествования уже сейчас.

10 инструментов

xix.ai

чат-бот

Создайте свою собственную любовную историю с ИИ с помощью этих инструментов для ролевых игр

Откройте для себя 2026 лучших инструментов для ролевых игр на базе ИИ, которые помогут вам создавать захватывающие истории. В тщательно подобранном списке XIX.AI представлены мощные, революционные помощники, которые раскроют ваш творческий потенциал в повествовании и придадут ему эмоциональную глубину. Сравните бесплатные и платные варианты на основе реальных тестов. Начните свое уникальное путешествие уже сегодня.

10 инструментов

xix.ai

Преобразование текста в речь

Лучшие инструменты искусственного интеллекта для независимых разработчиков игр: как сэкономить время на озвучке для RPG и визуальных новелл

Откройте для себя лучшие инструменты искусственного интеллекта для озвучивания в 2026 году, предназначенные для разработчиков игр! В тщательно составленном списке XIX.AI представлены самые популярные и революционные решения, которые помогут вам сэкономить время и деньги на озвучивании ролевых игр и визуальных новелл. Ознакомьтесь с сравнением бесплатных и платных версий, результатами реальных тестов и еженедельно обновляемыми рейтингами. Найдите свой идеальный инструмент для озвучивания уже сегодня!

10 инструментов

xix.ai

Образование и обучение

Лучшие инструменты искусственного интеллекта для систематического повторения материала: оптимизация учебных планов студентов-медиков и юристов

Откройте для себя лучшие инструменты для повторения материала с использованием технологий искусственного интеллекта в 2026 году, подобранные компанией XIX.AI. Наши самые популярные и революционные инструменты помогут студентам-медикам и юристам оптимизировать расписание занятий для лучшего запоминания информации. Сравните бесплатные и платные варианты с использованием реальных примеров и еженедельно обновляемых рейтингов. Раскройте для себя все возможности эффективного обучения уже сегодня.

10 инструментов

xix.ai

Создание видео

Лучшие платформы для преобразования текста в видео с помощью ИИ для написания сценариев и визуального повествования

2026: лучшие платформы для преобразования текста в видео с помощью ИИ: самые популярные инструменты для написания сценариев и визуального повествования. Откройте для себя мощные, революционные решения, которые помогут превратить ваш текст в увлекательные видеоролики. Сравните бесплатные и платные варианты с помощью наших еженедельно обновляемых рейтингов и реальных тестов. Найдите идеальную платформу, которая поможет вам раскрыть свой творческий потенциал и повысить продуктивность. Ознакомьтесь с тщательно подобранной подборкой на сайте XIX.AI.

10 инструментов

xix.ai

Комментарии (42)

0/500

Пожалуйста, войдите в систему

RichardJackson

16 ноября 2025 г., 17:30:37 GMT+03:00

こんなことされてしまうと、著作権料を払って制作している出版社側はたまったもんじゃないよね…AIの学習データの透明性、もっと求められるべきだと思う。🤔

PeterNelson

31 июля 2025 г., 14:35:39 GMT+03:00

This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅

HarperJones

23 апреля 2025 г., 5:24:27 GMT+03:00

OpenAI가 유료 책을 이용해 AI를 훈련했다니 좀 의심스럽네요. 한편으론 AI 성능이 인상적이지만, 데이터 소스를 더 나은 방법으로 찾아야 할 것 같아요. 🤔

WalterWhite

18 апреля 2025 г., 22:33:48 GMT+03:00

OpenAIの件については少し悩んでいます。O’Reillyの本を無断で使うのはちょっと気持ち悪いですが、彼らが作っているAIはかなりクールですね。次回は本の使用料を払うべきかも？🤔

BruceClark

18 апреля 2025 г., 5:02:34 GMT+03:00

OpenAIが有料の書籍を使ってAIを訓練しているのは少し問題があるかもしれません。でも、AIの性能は本当に素晴らしいですね。データのソースをより良い方法で見つける必要があると思います。🤔

DennisGarcia

18 апреля 2025 г., 4:58:35 GMT+03:00

I'm kinda torn about this OpenAI thing. On one hand, using those O’Reilly books without permission feels a bit off, you know? But on the other hand, the AI they're building is pretty slick! Maybe they should just pay for the books next time? 🤔

Лучшие новости

AI Builder и Power Automate Революционизируют Суммирование Документов AI Hosts of Notebooklm подкаста теперь доступны для интервью Китай представляет национальный гуманоидный робот и стандарты воплощенного интеллекта По данным Ramp, корпоративное внедрение ИИ находится на плаву Руководство по создателю изображений Bing: Гайд по генерации искусством ИИ Научитесь создавать музыку ИИ, используя свой голос: пошаговый учебник SUNO iMyFone MagicMic: Обзор и руководство по реальном времени AI изменению голоса Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами Компания Embodied Intelligence представляет первый отраслевой стандарт, призванный сдержать неконтролируемый рост DeepSeek V4 становится мультимодальным искусственным интеллектом, меняющим правила игры

Более

Показан