Openai의 AI는 월드 벽으로 된 O'Reilly 책을 훈련 시켰다고 연구원들은 주장했다

집

뉴스

2025년 4월 7일

JuanThomas

217

# openai

Openai의 AI는 월드 벽으로 된 O'Reilly 책을 훈련 시켰다고 연구원들은 주장했다

OpenAi는 AI 모델을 훈련시키는 권한없이 저작권이있는 자료를 사용한 수많은 비난에 직면했습니다. 2024 년 미디어 거물 Tim O'Reilly와 이코노미스트 인 Ilan Strauss가 설립 한 비영리 단체 인 AI Disclosures Project의 최근 연구에 따르면 OpenAi는 O'Reilly Media의 비 공개 서적을 사용하여 고급 모델 인 GPT-4O를 훈련시킬 수 있다고합니다. 본질적으로 정교한 예측 엔진 인 AI 모델은 책, 영화 및 TV 쇼를 포함한 방대한 데이터 세트에 대한 교육을받습니다. 그들은 패턴을 배우고 이러한 패턴을 기반으로 응답을 생성하며, 진정으로 새로운 것을 만들지 않고 광범위한 지식 기반에서 근사한 것을 만들어냅니다. 공개 웹과 같은 실제 데이터 소스가 소진되면서 OpenAI를 포함한 일부 AI 실험실은 교육을 위해 AI 생성 데이터를 사용하기 시작했지만 모델 성능 저하의 위험으로 인해 실제 데이터를 완전히 포기한 사람은 거의 없습니다. AI 공개 프로젝트의 논문은 ChatGpt의 기본값 인 OpenAi의 GPT-4O 모델이 이전 GPT-3.5 터보 모델과 달리 Paywalled O'Reilly 책의 컨텐츠에 대한 강력한 인식을 보여준다고 주장합니다. 이 논문은 O'Reilly Media가 OpenAI와의 라이센스 계약이 없음에도 불구하고 GPT-4O가 이러한 비 공개 책에 대해 훈련되었을 가능성이 있다고 제안합니다. 이 연구는 2024 년에 도입 된 DE-COP라는 방법을 사용하여 AI 교육 데이터의 저작권이있는 콘텐츠를 감지했습니다. 이 "멤버십 컨퍼런스 공격"은 모델이 인간 저술 텍스트와 AI 생성 된 역설을 구별 할 수 있는지 여부를 테스트하여 텍스트가 안정적으로 할 수있는 경우 텍스트에 대한 사전 지식을 나타냅니다. 연구원들은 34 개의 O'Reilly 책에서 13,962 개의 단락 발췌문을 사용하여 GPT-4O, GPT-3.5 Turbo 및 기타 OpenAI 모델을 테스트하여 GPT-4O가 구형 모델보다 훨씬 더 유료 콘텐츠를 인식했다는 것을 발견했습니다. 저자는 자신의 방법이 완벽하지 않으며 Paywalled 컨텐츠가 Chatgpt에 복사 및 붙여 넣기에 의해 소개되었을 수 있음을 인정하지만 OpenAI의 데이터 관행에 대한 질문이 제기됩니다. 이 연구는 GPT-4.5와 같은 OpenAI의 최신 모델 및 O3-MINI 및 O1과 같은 추론 모델을 평가하지 않았으며, 이들은 동일한 데이터에 대해 교육을받지 못했을 가능성이 있습니다. OpenAI는 AI 교육 데이터와 관련하여보다 편안한 저작권법을 추진하고 있으며 고품질 데이터 소스를 찾고 있습니다. 이 회사는 AI 시스템을 향상시키기 위해 다양한 분야의 전문가가 모집되는 AI 업계 전반에 걸쳐있는 모델의 생산량을 개선하기 위해 언론인을 고용했습니다. OpenAI는 다양한 컨텐츠 제공 업체와 라이센스 계약을 맺고 저작권 소유자를위한 옵트 아웃 메커니즘을 제공하는 일부 교육 데이터에 대해 지불합니다. 그러나 회사가 데이터 관행에 대한 법적 문제에 직면함에 따라 O'Reilly 논문의 결과는 운영에 대한 그림자를 시전했습니다. OpenAI는 연구에 대한 의견 요청에 응답하지 않았습니다.

관련 특별 주제 추천

비디오 제작

팟캐스터를 위한 최고의 AI 동영상 제작 도구: 오디오 파일을 흥미로운 토킹 헤드 영상으로 변환하세요

XIX.AI에서 팟캐스터를 위한 2026년 최고의 AI 동영상 제작 도구를 만나보세요. 엄선된 최고 평점 목록에는 오디오를 손쉽게 매력적인 토킹헤드 동영상으로 변환해 주는 강력한 도구들이 포함되어 있습니다. 실제 테스트와 매주 업데이트되는 순위를 통해 무료 및 유료 옵션을 비교해 보세요. 지금 바로 시각적 스토리텔링의 경쟁력을 확보하세요.

10 도구

xix.ai

챗봇

이 역할극 도구들로 나만의 AI 러브 스토리를 만들어 보세요

몰입감 넘치는 이야기를 만들어낼 수 있는 2026년 최신 최고 평점 AI 롤플레잉 도구를 만나보세요. XIX.AI가 엄선한 이 목록에는 창의적인 스토리텔링과 감성적 깊이를 이끌어내는 강력하고 혁신적인 어시스턴트들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 나만의 특별한 여정을 시작해 보세요.

10 도구

xix.ai

텍스트 음성 변환

인디 게임 개발자를 위한 최고의 AI 음성 도구: RPG와 비주얼 노벨의 성우 작업 시간을 단축하세요

게임 개발자를 위한 2026년 최고의 AI 음성 도구를 만나보세요! XIX.AI가 엄선한 이 목록에는 RPG와 비주얼 노벨의 성우 작업에 드는 시간과 비용을 절약해 줄, 최고 평점을 받은 혁신적인 솔루션들이 포함되어 있습니다. 무료 버전과 유료 버전의 비교 분석, 실제 테스트 결과, 매주 업데이트되는 순위 정보를 확인해 보세요. 지금 바로 여러분에게 딱 맞는 음성 도구를 찾아보세요!

10 도구

xix.ai

교육 및 학습

최고의 AI 기반 반복 학습 도구들: 의학 및 법학 전공 학생들을 위한 학습 계획 최적화 방법

2026년 최고의 AI 반복 학습 도구들을 만나보세요. XIX.AI가 엄선하여 제공합니다. 우리가 추천하는 이 도구들은 의학 및 법학 전공 학생들이 학습 계획을 최적화하여 최대한의 학습 효과를 얻는 데 도움을 줍니다. 무료 옵션과 유료 옵션을 실제 사용 사례와 매주 업데이트되는 순위를 통해 비교해 보세요. 지금 바로 학습 효율을 높이세요.

10 도구

xix.ai

비디오 제작

대본 작성과 시각적 스토리텔링을 위한 최고의 AI 텍스트-비디오 변환 플랫폼

2026년 최신 최고의 AI 텍스트-비디오 변환 플랫폼: 시나리오 작성과 시각적 스토리텔링을 위한 최고 평점 도구들. 텍스트를 매력적인 영상으로 변환해 줄 강력하고 혁신적인 솔루션을 만나보세요. 매주 업데이트되는 순위와 실제 테스트 결과를 통해 무료 및 유료 옵션을 비교해 보세요. 창의성과 생산성을 높여줄 완벽한 플랫폼을 찾아보세요. XIX.AI에서 엄선된 플랫폼을 확인해 보세요.

10 도구

xix.ai

챗봇

AI 멀티 에이전트 오케스트레이터: 자연어를 통해 복잡한 자동화 워크플로우를 설계하기

2026 최신 정보: 자연어를 통해 복잡한 자동화 워크플로우를 설계할 수 있는 최고의 AI 멀티 에이전트 오케스트레이터들을 만나보세요. 저희가 엄선한 이 목록에는 태스크 자동화와 지능형 프로세스 관리에 탁월한 최고의 플랫폼들이 포함되어 있습니다. 무료 옵션과 유료 옵션을 실제 사용 사례를 바탕으로 비교해 보세요. XIX.AI가 매주 업데이트하는 전문적인 순위를 통해 AI의 이점을 최대한 활용해 보세요.

10 도구

xix.ai

의견 (42)

0/500

먼저 로그인하십시오

RichardJackson

2025년 11월 16일 오후 11시 30분 37초 GMT+09:00

こんなことされてしまうと、著作権料を払って制作している出版社側はたまったもんじゃないよね…AIの学習データの透明性、もっと求められるべきだと思う。🤔

PeterNelson

2025년 7월 31일 오후 8시 35분 39초 GMT+09:00

This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅

HarperJones

2025년 4월 23일 오전 11시 24분 27초 GMT+09:00

OpenAI가 유료 책을 이용해 AI를 훈련했다니 좀 의심스럽네요. 한편으론 AI 성능이 인상적이지만, 데이터 소스를 더 나은 방법으로 찾아야 할 것 같아요. 🤔

WalterWhite

2025년 4월 19일 오전 4시 33분 48초 GMT+09:00

OpenAIの件については少し悩んでいます。O’Reillyの本を無断で使うのはちょっと気持ち悪いですが、彼らが作っているAIはかなりクールですね。次回は本の使用料を払うべきかも？🤔

BruceClark

2025년 4월 18일 오전 11시 2분 34초 GMT+09:00

OpenAIが有料の書籍を使ってAIを訓練しているのは少し問題があるかもしれません。でも、AIの性能は本当に素晴らしいですね。データのソースをより良い方法で見つける必要があると思います。🤔

DennisGarcia

2025년 4월 18일 오전 10시 58분 35초 GMT+09:00

I'm kinda torn about this OpenAI thing. On one hand, using those O’Reilly books without permission feels a bit off, you know? But on the other hand, the AI they're building is pretty slick! Maybe they should just pay for the books next time? 🤔

최고의 뉴스

AI Builder와 Power Automate가 문서 요약을 혁신하다 AI Notebooklm Podcast의 AI 호스트는 이제 인터뷰에 참여할 수 있습니다 중국, 국가 휴머노이드 로봇 및 구현 지능 표준 공개 기업 AI 도입 정체기, 램프 데이터에 따르면 Bing 이미지 크리에이터 튜토리얼: AI 아트 생성 가이드 당신의 목소리를 사용하여 AI 음악 만들기 배우기 : 단계별 Suno 튜토리얼 iMyFone MagicMic: 실시간 AI 음성 변환기 리뷰 및 튜토리얼 2025 최고 AI 비디오 생성기: Pika Labs 대 비교 엠보디드 인텔리전스, 무분별한 확장을 억제하기 위한 업계 최초의 표준을 발표하다 딥시크 V4, 다중 모달 AI의 판도를 바꾸는 혁신으로 부상하다

더