选项
首页
新闻
研究人员声称

研究人员声称

2025-04-07
169

研究人员声称

Openai未经允许培训其AI模型,面临着众多使用受版权保护的材料的指控。 AI披露项目的最新研究是由媒体大亨蒂姆·奥莱利(Tim O'Reilly)和经济学家伊兰·斯特劳斯(Ilan Strauss)于2024年成立的非营利组织,这表明Openai可能使用O'Reilly Media的非公开书籍来培训其更高级的模型GPT-4O。 AI模型,本质上是复杂的预测引擎,在包括书籍,电影和电视节目在内的大量数据集上进行了培训。他们学习模式并根据这些模式产生响应,而不是创造任何真正的新事物,而是从他们广泛的知识库中近似。随着像公共网络这样的现实数据源变得筋疲力尽,包括OpenAI在内的一些AI实验室已经开始使用AI生成的数据进行培训,尽管由于降低模型性能的风险,很少有人完全放弃了现实世界中的数据。 AI披露项目的论文声称,与较早的GPT-3.5 Turbo Model不同,OpenAI的GPT-4O模型是CHATGPT中的默认模型,显示了对Paywalled O'Reilly Books的内容的强烈认可。该论文表明,尽管O'Reilly Media没有与OpenAI达成许可协议,但GPT-4O可能接受了这些非公共书籍的培训。该研究采用了一种名为DE-COP的方法,该方法于2024年引入,以检测AI培训数据中受版权保护的内容。这种“成员推理攻击”测试了模型是否可以区分人类作者的文本和AI生成的释义,这表明文本可靠地了解文本。研究人员使用34本O'Reilly书籍中的13,962段摘录测试了GPT-4O,GPT-3.5 Turbo和其他OpenAI模型,发现GPT-4O与较旧模型相比,GPT-4O认识到的收费内容要多得多。虽然作者承认他们的方法不是万无一失,并且用户复制并粘贴到chatgpt中可能引入了付费内容,但这些发现引发了有关OpenAI数据实践的疑问。该研究没有评估OpenAI的最新模型,例如GPT-4.5和O3-Mini和O1等推理模型,因此打开了可能未接受相同数据培训的可能性。 Openai一直在推动有关AI培训数据的更轻松的版权法,并一直在寻求更高质量的数据源。该公司甚至雇用了记者来完善其模型的产出,这是在AI行业看到的这种做法,在该行业中,招募了各个领域的专家以增强AI系统。 OpenAI确实为其某些培训数据付费,与各种内容提供商达成许可协议,并为版权所有者提供退出机制。但是,由于该公司在其数据实践方面面临法律挑战,因此O'Reilly Paper的发现对其运营产生了阴影。 Openai没有回应对该研究发表评论的请求。
相关文章
英伟达的人工智能炒作遭遇现实,70%的利润率在推理大战中备受质疑 英伟达的人工智能炒作遭遇现实,70%的利润率在推理大战中备受质疑 人工智能芯片大战在 VB Transform 2025 上爆发在 VB Transform 2025 的一场激烈的小组讨论中,战线已经拉开,崛起的挑战者直接瞄准了 Nvidia 的市场主导地位。核心问题暴露了一个明显的矛盾:人工智能推理如何既能被称为商品化的 "工厂",又能带来 70% 的巨大毛利率?挑战者大声疾呼Groq 首席执行官乔纳森-罗斯(Jonathan Ross)一针见血地指出
OpenAI 将 ChatGPT Pro 升级到 o3,提升 200 美元月费的价值 OpenAI 将 ChatGPT Pro 升级到 o3,提升 200 美元月费的价值 本周,微软(Microsoft)、谷歌(Google)和人类学(Anthropic)等科技巨头都发布了重要的人工智能发展成果。OpenAI 以自己的突破性更新结束了这一轮的公告发布--除了高调斥资 65 亿美元收购 Jony Ive 的设计公司,还推出了代号为 "io "的雄心勃勃的硬件计划。公司大幅增强了 ChatGPT 中的 Operator 自主网络导航系统,从以前的 GPT-4o 框架过渡
非营利组织利用人工智能代理促进慈善筹款工作 非营利组织利用人工智能代理促进慈善筹款工作 当大型科技公司将人工智能 "代理 "作为企业生产力的助推器进行推广时,一家非营利组织正在展示它们在社会公益方面的潜力。由开放慈善组织(Open Philanthropy)支持的慈善研究机构赛智未来(Sage Future)最近进行了一项创新实验,展示了人工智能模型如何在慈善筹款方面进行合作。该非营利组织在一个模拟数字环境中设置了四个先进的人工智能模型--OpenAI 的 GPT-4o 和 o1
评论 (41)
0/200
PeterNelson
PeterNelson 2025-07-31 19:35:39

This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅

HarperJones
HarperJones 2025-04-23 10:24:27

OpenAI가 유료 책을 이용해 AI를 훈련했다니 좀 의심스럽네요. 한편으론 AI 성능이 인상적이지만, 데이터 소스를 더 나은 방법으로 찾아야 할 것 같아요. 🤔

WalterWhite
WalterWhite 2025-04-19 03:33:48

OpenAIの件については少し悩んでいます。O’Reillyの本を無断で使うのはちょっと気持ち悪いですが、彼らが作っているAIはかなりクールですね。次回は本の使用料を払うべきかも?🤔

BruceClark
BruceClark 2025-04-18 10:02:34

OpenAIが有料の書籍を使ってAIを訓練しているのは少し問題があるかもしれません。でも、AIの性能は本当に素晴らしいですね。データのソースをより良い方法で見つける必要があると思います。🤔

DennisGarcia
DennisGarcia 2025-04-18 09:58:35

I'm kinda torn about this OpenAI thing. On one hand, using those O’Reilly books without permission feels a bit off, you know? But on the other hand, the AI they're building is pretty slick! Maybe they should just pay for the books next time? 🤔

AvaHill
AvaHill 2025-04-17 02:00:26

Estoy un poco dividido sobre que OpenAI use libros de pago para entrenar su IA. Por un lado, es un poco sospechoso, pero por otro, la IA es impresionante. Creo que necesitan encontrar una mejor manera de obtener sus datos, ¿no? 🤔

返回顶部
OR