옵션
소식 Openai의 AI는 월드 벽으로 된 O'Reilly 책을 훈련 시켰다고 연구원들은 주장했다

Openai의 AI는 월드 벽으로 된 O'Reilly 책을 훈련 시켰다고 연구원들은 주장했다

출시일 출시일 2025년 4월 7일
작가 작가 JuanThomas
보기 보기 94

Openai의 AI는 월드 벽으로 된 O'Reilly 책을 훈련 시켰다고 연구원들은 주장했다

OpenAi는 AI 모델을 훈련시키는 권한없이 저작권이있는 자료를 사용한 수많은 비난에 직면했습니다. 2024 년 미디어 거물 Tim O'Reilly와 이코노미스트 인 Ilan Strauss가 설립 한 비영리 단체 인 AI Disclosures Project의 최근 연구에 따르면 OpenAi는 O'Reilly Media의 비 공개 서적을 사용하여 고급 모델 인 GPT-4O를 훈련시킬 수 있다고합니다. 본질적으로 정교한 예측 엔진 인 AI 모델은 책, 영화 및 TV 쇼를 포함한 방대한 데이터 세트에 대한 교육을받습니다. 그들은 패턴을 배우고 이러한 패턴을 기반으로 응답을 생성하며, 진정으로 새로운 것을 만들지 않고 광범위한 지식 기반에서 근사한 것을 만들어냅니다. 공개 웹과 같은 실제 데이터 소스가 소진되면서 OpenAI를 포함한 일부 AI 실험실은 교육을 위해 AI 생성 데이터를 사용하기 시작했지만 모델 성능 저하의 위험으로 인해 실제 데이터를 완전히 포기한 사람은 거의 없습니다. AI 공개 프로젝트의 논문은 ChatGpt의 기본값 인 OpenAi의 GPT-4O 모델이 이전 GPT-3.5 터보 모델과 달리 Paywalled O'Reilly 책의 컨텐츠에 대한 강력한 인식을 보여준다고 주장합니다. 이 논문은 O'Reilly Media가 OpenAI와의 라이센스 계약이 없음에도 불구하고 GPT-4O가 이러한 비 공개 책에 대해 훈련되었을 가능성이 있다고 제안합니다. 이 연구는 2024 년에 도입 된 DE-COP라는 방법을 사용하여 AI 교육 데이터의 저작권이있는 콘텐츠를 감지했습니다. 이 "멤버십 컨퍼런스 공격"은 모델이 인간 저술 텍스트와 AI 생성 된 역설을 구별 할 수 있는지 여부를 테스트하여 텍스트가 안정적으로 할 수있는 경우 텍스트에 대한 사전 지식을 나타냅니다. 연구원들은 34 개의 O'Reilly 책에서 13,962 개의 단락 발췌문을 사용하여 GPT-4O, GPT-3.5 Turbo 및 기타 OpenAI 모델을 테스트하여 GPT-4O가 구형 모델보다 훨씬 더 유료 콘텐츠를 인식했다는 것을 발견했습니다. 저자는 자신의 방법이 완벽하지 않으며 Paywalled 컨텐츠가 Chatgpt에 복사 및 붙여 넣기에 의해 소개되었을 수 있음을 인정하지만 OpenAI의 데이터 관행에 대한 질문이 제기됩니다. 이 연구는 GPT-4.5와 같은 OpenAI의 최신 모델 및 O3-MINI 및 O1과 같은 추론 모델을 평가하지 않았으며, 이들은 동일한 데이터에 대해 교육을받지 못했을 가능성이 있습니다. OpenAI는 AI 교육 데이터와 관련하여보다 편안한 저작권법을 추진하고 있으며 고품질 데이터 소스를 찾고 있습니다. 이 회사는 AI 시스템을 향상시키기 위해 다양한 분야의 전문가가 모집되는 AI 업계 전반에 걸쳐있는 모델의 생산량을 개선하기 위해 언론인을 고용했습니다. OpenAI는 다양한 컨텐츠 제공 업체와 라이센스 계약을 맺고 저작권 소유자를위한 옵트 아웃 메커니즘을 제공하는 일부 교육 데이터에 대해 지불합니다. 그러나 회사가 데이터 관행에 대한 법적 문제에 직면함에 따라 O'Reilly 논문의 결과는 운영에 대한 그림자를 시전했습니다. OpenAI는 연구에 대한 의견 요청에 응답하지 않았습니다.
관련 기사
Google検索では、複雑なマルチパートクエリ用に「AIモード」が導入されています Google検索では、複雑なマルチパートクエリ用に「AIモード」が導入されています Googleは「AIモード」を検索して、Prplexity AIとChatGptgoogleに対抗し、AIアリーナでゲームを強化し、検索エンジンで実験的な「AIモード」機能を開始します。 Perplexity AIやOpenaiのChatGPT検索などを引き受けることを目的としたこの新しいモードは、水で発表されました
chatgptのユーザー名の未承諾の使用は、一部の人の間で「不気味な」懸念を引き起こします chatgptのユーザー名の未承諾の使用は、一部の人の間で「不気味な」懸念を引き起こします ChatGPTの一部のユーザーは最近、奇妙な新機能に遭遇しました。チャットボットは、問題を乗り越えながら名前を使用することがあります。これは以前の通常の動作の一部ではなく、多くのユーザーがChatGptが何を呼ぶかを言わずに自分の名前に言及すると報告しています。意見
OpenaiはChatGptを強化して、以前の会話を思い出します OpenaiはChatGptを強化して、以前の会話を思い出します Openaiは木曜日に、「Memory」と呼ばれるChatGptの新鮮な機能を展開することについて大きな発表を行いました。この気の利いたツールは、以前に話したことを思い出すことにより、AIとのチャットをよりパーソナライズするように設計されています。あなたが新しい詐欺を始めるたびに自分自身を繰り返す必要がないと想像してください
의견 (40)
0/200
RoyPerez
RoyPerez 2025년 4월 11일 오전 4시 31분 26초 GMT

So, OpenAI's AI got trained on paywalled books? That's a bit shady, isn't it? I mean, I love the tech, but using copyrighted material without permission? Come on, OpenAI, you can do better than that. Maybe they should focus on creating their own content instead.

KeithGonzález
KeithGonzález 2025년 4월 10일 오후 7시 27분 39초 GMT

オープンAIのAIが有料の本で訓練されたって?ちょっと怪しいよね?技術は好きだけど、許可なく著作権物を使うなんて。オープンAI、もっとできるはずだよ。自分のコンテンツを作ることに集中すべきだね。

MatthewHill
MatthewHill 2025년 4월 7일 오후 7시 28분 56초 GMT

오픈AI의 AI가 유료 책으로 훈련되었다고요? 좀 수상하죠? 기술은 좋아하지만, 허락 없이 저작권이 있는 자료를 사용하다니요. 오픈AI, 더 잘할 수 있어요. 자신의 콘텐츠를 만드는 데 집중해야 해요.

BenWalker
BenWalker 2025년 4월 9일 오후 1시 31분 14초 GMT

Então, a IA da OpenAI foi treinada com livros pagos? Isso é um pouco suspeito, não é? Eu gosto da tecnologia, mas usar material com direitos autorais sem permissão? Vamos, OpenAI, você pode fazer melhor do que isso. Talvez eles deveriam se concentrar em criar seu próprio conteúdo.

FrankMartínez
FrankMartínez 2025년 4월 9일 오전 10시 3분 15초 GMT

¿Así que la IA de OpenAI fue entrenada con libros de pago? Eso es un poco sospechoso, ¿no? Me gusta la tecnología, pero usar material con derechos de autor sin permiso... Vamos, OpenAI, puedes hacerlo mejor. Tal vez deberían centrarse en crear su propio contenido.

LarryHernández
LarryHernández 2025년 4월 10일 오전 6시 32분 40초 GMT

I'm torn about OpenAI using O’Reilly books to train their AI. On one hand, it's impressive how advanced their models are getting. On the other, it feels a bit shady to use paywalled content. I guess innovation sometimes walks a fine line, huh? Maybe they should just pay for the books next time!

위로 돌아갑니다
OR