Openai의 AI는 월드 벽으로 된 O'Reilly 책을 훈련 시켰다고 연구원들은 주장했다

OpenAi는 AI 모델을 훈련시키는 권한없이 저작권이있는 자료를 사용한 수많은 비난에 직면했습니다. 2024 년 미디어 거물 Tim O'Reilly와 이코노미스트 인 Ilan Strauss가 설립 한 비영리 단체 인 AI Disclosures Project의 최근 연구에 따르면 OpenAi는 O'Reilly Media의 비 공개 서적을 사용하여 고급 모델 인 GPT-4O를 훈련시킬 수 있다고합니다. 본질적으로 정교한 예측 엔진 인 AI 모델은 책, 영화 및 TV 쇼를 포함한 방대한 데이터 세트에 대한 교육을받습니다. 그들은 패턴을 배우고 이러한 패턴을 기반으로 응답을 생성하며, 진정으로 새로운 것을 만들지 않고 광범위한 지식 기반에서 근사한 것을 만들어냅니다. 공개 웹과 같은 실제 데이터 소스가 소진되면서 OpenAI를 포함한 일부 AI 실험실은 교육을 위해 AI 생성 데이터를 사용하기 시작했지만 모델 성능 저하의 위험으로 인해 실제 데이터를 완전히 포기한 사람은 거의 없습니다. AI 공개 프로젝트의 논문은 ChatGpt의 기본값 인 OpenAi의 GPT-4O 모델이 이전 GPT-3.5 터보 모델과 달리 Paywalled O'Reilly 책의 컨텐츠에 대한 강력한 인식을 보여준다고 주장합니다. 이 논문은 O'Reilly Media가 OpenAI와의 라이센스 계약이 없음에도 불구하고 GPT-4O가 이러한 비 공개 책에 대해 훈련되었을 가능성이 있다고 제안합니다. 이 연구는 2024 년에 도입 된 DE-COP라는 방법을 사용하여 AI 교육 데이터의 저작권이있는 콘텐츠를 감지했습니다. 이 "멤버십 컨퍼런스 공격"은 모델이 인간 저술 텍스트와 AI 생성 된 역설을 구별 할 수 있는지 여부를 테스트하여 텍스트가 안정적으로 할 수있는 경우 텍스트에 대한 사전 지식을 나타냅니다. 연구원들은 34 개의 O'Reilly 책에서 13,962 개의 단락 발췌문을 사용하여 GPT-4O, GPT-3.5 Turbo 및 기타 OpenAI 모델을 테스트하여 GPT-4O가 구형 모델보다 훨씬 더 유료 콘텐츠를 인식했다는 것을 발견했습니다. 저자는 자신의 방법이 완벽하지 않으며 Paywalled 컨텐츠가 Chatgpt에 복사 및 붙여 넣기에 의해 소개되었을 수 있음을 인정하지만 OpenAI의 데이터 관행에 대한 질문이 제기됩니다. 이 연구는 GPT-4.5와 같은 OpenAI의 최신 모델 및 O3-MINI 및 O1과 같은 추론 모델을 평가하지 않았으며, 이들은 동일한 데이터에 대해 교육을받지 못했을 가능성이 있습니다. OpenAI는 AI 교육 데이터와 관련하여보다 편안한 저작권법을 추진하고 있으며 고품질 데이터 소스를 찾고 있습니다. 이 회사는 AI 시스템을 향상시키기 위해 다양한 분야의 전문가가 모집되는 AI 업계 전반에 걸쳐있는 모델의 생산량을 개선하기 위해 언론인을 고용했습니다. OpenAI는 다양한 컨텐츠 제공 업체와 라이센스 계약을 맺고 저작권 소유자를위한 옵트 아웃 메커니즘을 제공하는 일부 교육 데이터에 대해 지불합니다. 그러나 회사가 데이터 관행에 대한 법적 문제에 직면함에 따라 O'Reilly 논문의 결과는 운영에 대한 그림자를 시전했습니다. OpenAI는 연구에 대한 의견 요청에 응답하지 않았습니다.
관련 기사
오픈AI, AI 기반 개인 재무 관리 스타트업 히로 인수
오픈AI가 개인 금융 스타트업 ‘히로 파이낸스(Hiro Finance)’를 인수했다고 설립자 에단 블로크가 월요일 발표했으며, 오픈AI는 테크크런치에 이 거래를 확인했다. 이 스타트업은 최고의 핀테크 벤처 캐피털 기업인 리빗(Ribbit)을 비롯해 제너럴 카탈리스트(General Catalyst)와 레스티브(Restive)의 투자를 받아왔다.인수 조건은 공
사티야 나델라, 새로운 오픈AI 협력을 활용할 준비가 되었다
수요일에 월스트리트의 한 애널리스트가 마이크로소프트의 사티야 나델라 CEO에게 개정된 오픈AI와의 파트너십이 회사의 재무 상황에 어떤 영향을 미칠지 직접 물었습니다.나델라는 이 새로운 협약이 모든 당사자에게 이익이 된다고 설명했습니다. “오픈AI와의 파트너십에 대해 우리는 만족하고 있습니다. 저는 언제나 모든 파트너십에서 상호 이익이 되도록 하는 데 집중합니다. 그렇게 해야만 좋은 파트너로 남을 수 있기 때문입니다.”그는 마이크로소프트가 여
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
관련 특별 주제 추천
의견 (42)
0/500
This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅

오픈AI, AI 기반 개인 재무 관리 스타트업 히로 인수
오픈AI가 개인 금융 스타트업 ‘히로 파이낸스(Hiro Finance)’를 인수했다고 설립자 에단 블로크가 월요일 발표했으며, 오픈AI는 테크크런치에 이 거래를 확인했다. 이 스타트업은 최고의 핀테크 벤처 캐피털 기업인 리빗(Ribbit)을 비롯해 제너럴 카탈리스트(General Catalyst)와 레스티브(Restive)의 투자를 받아왔다.인수 조건은 공
사티야 나델라, 새로운 오픈AI 협력을 활용할 준비가 되었다
수요일에 월스트리트의 한 애널리스트가 마이크로소프트의 사티야 나델라 CEO에게 개정된 오픈AI와의 파트너십이 회사의 재무 상황에 어떤 영향을 미칠지 직접 물었습니다.나델라는 이 새로운 협약이 모든 당사자에게 이익이 된다고 설명했습니다. “오픈AI와의 파트너십에 대해 우리는 만족하고 있습니다. 저는 언제나 모든 파트너십에서 상호 이익이 되도록 하는 데 집중합니다. 그렇게 해야만 좋은 파트너로 남을 수 있기 때문입니다.”그는 마이크로소프트가 여
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅





집






