вариант
Дом Новости Исследователи утверждают, что ИИ Openai обучался на платежных книгах О'Рейли

Исследователи утверждают, что ИИ Openai обучался на платежных книгах О'Рейли

Дата выпуска Дата выпуска 7 апреля 2025 г.
Автор Автор JuanThomas
виды виды 94

Исследователи утверждают, что ИИ Openai обучался на платежных книгах О'Рейли

OpenAI столкнулся с многочисленными обвинениями в использовании защищенных авторским правом материала без разрешения на обучение моделей ИИ. Недавнее исследование, проведенное проектом по раскрытию информации AI, некоммерческой организации, созданная в 2024 году медиа-магнатом Тимом О'Рейли и экономистом Илан Штраусом, предполагает, что OpenAI, возможно, использовал непубличные книги из O'Reilly Media для обучения своей более продвинутой модели GPT-4O. Модели ИИ, по существу сложные двигатели прогнозирования, обучены обширным наборам данных, включая книги, фильмы и телешоу. Они изучают шаблоны и генерируют ответы на основе этих моделей, не создают что -то действительно новое, а скорее приближаются к их обширной базе знаний. По мере того, как реальные источники данных, такие как публичная сеть, исчерпаны, некоторые лаборатории искусственного интеллекта, включая OpenAI, начали использовать сгенерированные AI данных для обучения, хотя немногие полностью отказались от реальных данных из-за риска снижения производительности модели. В документе проекта AI раскрытия утверждается, что модель GPT-4O OpenAI, которая является по умолчанию в CHATGPT, показывает сильное распознавание контента из книг «О'Рейли», в отличие от более ранней модели Turbo GPT-3.5. В документе предполагается, что GPT-4O, вероятно, обучался этим непубличным книгам, несмотря на то, что O'Reilly Media не имел лицензионного соглашения с OpenAI. В исследовании использовался метод, называемый DE-COP, введенный в 2024 году, для обнаружения защищенного авторским правом контента в данных обучения искусственного интеллекта. Эта «атака по выводу членства» проверяет, может ли модель различать тексты, авторизованные человеком и парафразы, сгенерированные AI, что указывает на предварительное знание текста, если он может сделать это надежно. Исследователи протестировали модели GPT-4O, GPT-3.5 Turbo и другие модели OpenAI, используя 13 962 выдержки абзаца из 34 книг O'Reilly, обнаружив, что GPT-4O обнаружил значительно больше контента с платной, чем более старые модели. В то время как авторы признают, что их метод не является надежным, и что контент с платной, возможно, был представлен пользователями, копирующими и вставленными в CHATGPT, результаты поднимают вопросы о практике данных OpenAI. Исследование не оценило последние модели OpenAI, такие как модели GPT-4.5 и рассуждения, такие как O3-Mini и O1, оставив открыть возможность того, что они, возможно, не были обучены тем же данным. OpenAI стремится к более расслабленным законам об авторском праве, касающихся данных обучения ИИ и ищет более качественные источники данных. Компания даже наняла журналистов, чтобы усовершенствовать результаты своих моделей, практику, которую можно увидеть в отрасли искусственного интеллекта, где эксперты в различных областях набираются для улучшения систем ИИ. OpenAI платит за некоторые из своих учебных данных, имея лицензионные соглашения с различными поставщиками контента и предлагая механизмы отказа для владельцев авторских прав. Однако, поскольку компания сталкивается с юридическими проблемами в отношении своей практики данных, результаты бумаги O'Reilly отдают тень на свою деятельность. OpenAI не ответил на запросы о прокомментировании исследования.
Связанная статья
Tìm kiếm Google giới thiệu 'chế độ AI' cho các truy vấn phức tạp, đa phần Tìm kiếm Google giới thiệu 'chế độ AI' cho các truy vấn phức tạp, đa phần Google tiết lộ "Chế độ AI" khi tìm kiếm đối thủ Perplexity AI và Chatgptgoogle đang đẩy mạnh trò chơi của mình trong AI Arena với sự ra mắt của tính năng "AI Mode" thử nghiệm trong công cụ tìm kiếm. Nhằm mục đích tham gia vào tìm kiếm của Perplexity AI và Openai, chế độ mới này đã được công bố vào Wed
Việc sử dụng tên người dùng không được yêu cầu của Chats Việc sử dụng tên người dùng không được yêu cầu của Chats Một số người dùng Chatgpt gần đây đã gặp phải một tính năng mới kỳ lạ: Chatbot thỉnh thoảng sử dụng tên của họ trong khi làm việc thông qua các vấn đề. Đây không phải là một phần của hành vi thông thường của nó trước đây và nhiều người dùng báo cáo rằng TATGPT đề cập đến tên của họ mà không bao giờ được nói những gì cần gọi họ. Ý kiến ​​về
Openai tăng cường Chatgpt để nhớ lại các cuộc hội thoại trước đó Openai tăng cường Chatgpt để nhớ lại các cuộc hội thoại trước đó Openai đã đưa ra một thông báo lớn vào thứ năm về việc tung ra một tính năng mới trong TATGPT có tên là "Bộ nhớ". Công cụ tiện lợi này được thiết kế để làm cho các cuộc trò chuyện của bạn với AI được cá nhân hóa hơn bằng cách ghi nhớ những gì bạn đã nói trước đây. Hãy tưởng tượng không phải lặp lại bản thân mỗi khi bạn bắt đầu một cuộc truyền đạt mới
Комментарии (40)
RoyPerez
RoyPerez 11 апреля 2025 г., 4:31:26 GMT

So, OpenAI's AI got trained on paywalled books? That's a bit shady, isn't it? I mean, I love the tech, but using copyrighted material without permission? Come on, OpenAI, you can do better than that. Maybe they should focus on creating their own content instead.

KeithGonzález
KeithGonzález 10 апреля 2025 г., 19:27:39 GMT

オープンAIのAIが有料の本で訓練されたって?ちょっと怪しいよね?技術は好きだけど、許可なく著作権物を使うなんて。オープンAI、もっとできるはずだよ。自分のコンテンツを作ることに集中すべきだね。

MatthewHill
MatthewHill 7 апреля 2025 г., 19:28:56 GMT

오픈AI의 AI가 유료 책으로 훈련되었다고요? 좀 수상하죠? 기술은 좋아하지만, 허락 없이 저작권이 있는 자료를 사용하다니요. 오픈AI, 더 잘할 수 있어요. 자신의 콘텐츠를 만드는 데 집중해야 해요.

BenWalker
BenWalker 9 апреля 2025 г., 13:31:14 GMT

Então, a IA da OpenAI foi treinada com livros pagos? Isso é um pouco suspeito, não é? Eu gosto da tecnologia, mas usar material com direitos autorais sem permissão? Vamos, OpenAI, você pode fazer melhor do que isso. Talvez eles deveriam se concentrar em criar seu próprio conteúdo.

FrankMartínez
FrankMartínez 9 апреля 2025 г., 10:03:15 GMT

¿Así que la IA de OpenAI fue entrenada con libros de pago? Eso es un poco sospechoso, ¿no? Me gusta la tecnología, pero usar material con derechos de autor sin permiso... Vamos, OpenAI, puedes hacerlo mejor. Tal vez deberían centrarse en crear su propio contenido.

LarryHernández
LarryHernández 10 апреля 2025 г., 6:32:40 GMT

I'm torn about OpenAI using O’Reilly books to train their AI. On one hand, it's impressive how advanced their models are getting. On the other, it feels a bit shady to use paywalled content. I guess innovation sometimes walks a fine line, huh? Maybe they should just pay for the books next time!

Вернуться к вершине
OR