選項
首頁
新聞
研究人員聲稱

研究人員聲稱

2025-04-07
161

研究人員聲稱

Openai未經允許培訓其AI模型,面臨著眾多使用受版權保護的材料的指控。 AI披露項目的最新研究是由媒體大亨蒂姆·奧萊利(Tim O'Reilly)和經濟學家伊蘭·斯特勞斯(Ilan Strauss)於2024年成立的非營利組織,這表明Openai可能使用O'Reilly Media的非公開書籍來培訓其更高級的模型GPT-4O。 AI模型,本質上是複雜的預測引擎,在包括書籍,電影和電視節目在內的大量數據集上進行了培訓。他們學習模式並根據這些模式產生響應,而不是創造任何真正的新事物,而是從他們廣泛的知識庫中近似。隨著像公共網絡這樣的現實數據源變得筋疲力盡,包括OpenAI在內的一些AI實驗室已經開始使用AI生成的數據進行培訓,儘管由於降低模型性能的風險,很少有人完全放棄了現實世界中的數據。 AI披露項目的論文聲稱,與較早的GPT-3.5 Turbo Model不同,OpenAI的GPT-4O模型是CHATGPT中的默認模型,顯示了對Paywalled O'Reilly Books的內容的強烈認可。該論文表明,儘管O'Reilly Media沒有與OpenAI達成許可協議,但GPT-4O可能接受了這些非公共書籍的培訓。該研究採用了一種名為DE-COP的方法,該方法於2024年引入,以檢測AI培訓數據中受版權保護的內容。這種“成員推理攻擊”測試了模型是否可以區分人類作者的文本和AI生成的釋義,這表明文本可靠地了解文本。研究人員使用34本O'Reilly書籍中的13,962段摘錄測試了GPT-4O,GPT-3.5 Turbo和其他OpenAI模型,發現GPT-4O與較舊模型相比,GPT-4O認識到的收費內容要多得多。雖然作者承認他們的方法不是萬無一失,並且用戶複製並粘貼到chatgpt中可能引入了付費內容,但這些發現引發了有關OpenAI數據實踐的疑問。該研究沒有評估OpenAI的最新模型,例如GPT-4.5和O3-Mini和O1等推理模型,因此打開了可能未接受相同數據培訓的可能性。 Openai一直在推動有關AI培訓數據的更輕鬆的版權法,並一直在尋求更高質量的數據源。該公司甚至僱用了記者來完善其模型的產出,這是在AI行業看到的這種做法,在該行業中,招募了各個領域的專家以增強AI系統。 OpenAI確實為其某些培訓數據付費,與各種內容提供商達成許可協議,並為版權所有者提供退出機制。但是,由於該公司在其數據實踐方面面臨法律挑戰,因此O'Reilly Paper的發現對其運營產生了陰影。 Openai沒有回應對該研究發表評論的請求。
相關文章
甲骨文40億美元Nvidia晶片投資推動德州AI數據中心 甲骨文40億美元Nvidia晶片投資推動德州AI數據中心 據《金融時報》報導,甲骨文計劃投資約40億美元於Nvidia晶片,為OpenAI在德州開發的大型新數據中心提供動力。這筆交易是迄今為止最大的晶片收購之一,凸顯了對AI運算資源的激增需求。該設施位於德州阿比林,是美國首個「星門」數據中心。由OpenAI和軟銀支持,屬於建設大規模AI基礎設施的更廣泛計劃的一部分。該德州中心預計明年完工,將提供1.2吉瓦的運算能力,位列全球最大之列。甲骨文計劃採購約40
軟銀以6.76億美元收購夏普工廠用於日本AI數據中心 軟銀以6.76億美元收購夏普工廠用於日本AI數據中心 軟銀正推進其在日本建立主要AI中心的目標,獨立進行並透過與OpenAI等合作。該科技巨頭於週五確認,將投資6.76億美元收購一座前夏普LCD面板工廠,將其轉型為AI數據中心。軟銀與夏普的交易包括位於大阪的堺工廠的土地和建築物,購買價格為1000億日元(6.76億美元)。此次收購對軟銀來說是關鍵一步,因為數據中心對於生成式AI革命至關重要,需要大量容量來訓練模型並支持持續服務。當被問及該地點是否將支
Adobe與Figma整合OpenAI的先進圖像生成模型 Adobe與Figma整合OpenAI的先進圖像生成模型 OpenAI在ChatGPT中增強的圖像生成功能帶動了用戶激增,這得益於其生成吉卜力工作室風格視覺效果和獨特設計的能力,現正擴展至其他平台。該公司在一篇博客文章中宣佈,驅動此功能的“原生多模態模型”將通過其API以“gpt-image-1”的形式提供,主要公司已開始採用。“該模型的靈活性使其能夠生成多樣化風格的圖像,遵循自定義指南,利用廣泛的世界知識,並精確渲染文字——為各行各業開啟了廣泛的實際應
評論 (41)
0/200
PeterNelson
PeterNelson 2025-07-31 19:35:39

This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅

HarperJones
HarperJones 2025-04-23 10:24:27

OpenAI가 유료 책을 이용해 AI를 훈련했다니 좀 의심스럽네요. 한편으론 AI 성능이 인상적이지만, 데이터 소스를 더 나은 방법으로 찾아야 할 것 같아요. 🤔

WalterWhite
WalterWhite 2025-04-19 03:33:48

OpenAIの件については少し悩んでいます。O’Reillyの本を無断で使うのはちょっと気持ち悪いですが、彼らが作っているAIはかなりクールですね。次回は本の使用料を払うべきかも?🤔

BruceClark
BruceClark 2025-04-18 10:02:34

OpenAIが有料の書籍を使ってAIを訓練しているのは少し問題があるかもしれません。でも、AIの性能は本当に素晴らしいですね。データのソースをより良い方法で見つける必要があると思います。🤔

DennisGarcia
DennisGarcia 2025-04-18 09:58:35

I'm kinda torn about this OpenAI thing. On one hand, using those O’Reilly books without permission feels a bit off, you know? But on the other hand, the AI they're building is pretty slick! Maybe they should just pay for the books next time? 🤔

AvaHill
AvaHill 2025-04-17 02:00:26

Estoy un poco dividido sobre que OpenAI use libros de pago para entrenar su IA. Por un lado, es un poco sospechoso, pero por otro, la IA es impresionante. Creo que necesitan encontrar una mejor manera de obtener sus datos, ¿no? 🤔

回到頂部
OR