Microsoft探索了信用AI数据贡献者

微软正在启动一个新的研究项目,旨在了解特定训练示例如何影响生成式AI模型的输出,如文本、图像和其他媒体。此举措在一份12月的招聘广告中被提及,该广告最近在LinkedIn上重新出现,招聘一名研究实习生加入该项目。
该项目的目标是开发一种方法来训练模型,以便“高效且实用地估计”特定数据(如照片和书籍)对其输出的影响。招聘广告指出,当前神经网络架构在追踪输出来源方面缺乏透明度,解决这一问题有充分理由。其中一个原因是为向未来AI模型贡献有价值数据的个人提供激励、认可甚至补偿的潜力。
此研究的背景是涉及AI公司的持续法律争议,包括微软,关于知识产权的争端。AI模型通常在从公共网站抓取的大量数据集上进行训练,其中可能包含受版权保护的材料。虽然AI公司常以合理使用原则寻求保护,但各领域的创作者——艺术家、程序员、作家——对此立场提出异议。
微软目前面临法律挑战,包括《纽约时报》提起的诉讼,指控微软和OpenAI通过使用其文章训练模型侵犯了版权。此外,多名软件开发者因微软的GitHub Copilot AI编码助手使用他们的受版权保护代码提起诉讼。
该研究项目被称为“训练时出处”,由微软研究部门的知名技术专家Jaron Lanier参与。Lanier此前曾撰文讨论“数据尊严”,倡导建立一个系统,将数字内容与其创作者关联,并可能为他们对AI输出的贡献提供补偿。
虽然微软的项目仍处于早期阶段,但Bria、Adobe和Shutterstock等其他公司已在尝试根据数据拥有者对AI模型的贡献进行补偿。然而,大型AI实验室通常未建立个人贡献者支付计划,而是选择许可协议或版权持有者的退出机制,这些机制可能繁琐且范围有限。
微软的举措可能仅停留在概念验证阶段,类似于OpenAI尚未发布的创作者控制其作品如何用于训练数据的工具。还有猜测称,微软可能试图“道德洗白”其AI实践或预先应对监管和法律挑战。
鉴于Google和OpenAI等其他AI实验室最近呼吁美国政府放宽AI开发的版权保护,微软的这一举措尤为引人注目。微软尚未对有关该项目的评论请求作出回应。
相关文章
美国将因社交媒体法规制裁外国官员
美国站出来反对全球数字内容法规美国国务院本周针对欧洲的数字治理政策发出了尖锐的外交斥责,表明在网络平台控制权问题上的紧张局势正在升级。国务卿马可-卢比奥(Marco Rubio)公布了一项新的签证限制政策,该政策针对的是参与美国认为影响美国数字空间的过度审查的外国官员。新签证限制解释根据周三宣布的政策,美国将拒绝被认定正在执行影响美国受保护言论的海外内容法规的外国公民入境。卢比奥强调了两
人工智能驱动的 YouTube 视频摘要器终极指南
在我们信息丰富的数字环境中,人工智能驱动的 YouTube 视频摘要器已成为高效内容消费不可或缺的工具。本深度指南探讨了如何利用最先进的 NLP 技术(特别是来自 Hugging Face 的 BART 模型与 YouTube 的 Transcript API 相结合)构建复杂的摘要工具。无论您是要开发生产力工具、增强可访问性解决方案,还是要创建教育资源,本指南都能为您提供实现专业级摘要所需的一切
Atlassian 斥资 6.1 亿美元收购浏览器公司,加强开发人员工具
企业生产力软件领导者 Atlassian 宣布,计划以 6.1 亿美元的全现金交易收购创新型浏览器开发商 The Browser Company。这一战略举措旨在通过整合为现代知识工作者量身定制的人工智能功能,彻底改变工作场所的浏览方式。"Atlassian首席执行官兼联合创始人迈克-坎农-布鲁克斯(Mike Cannon-Brookes)表示:"传统浏览器是为休闲网上冲浪而设计的,而不是为当
评论 (34)
0/200
JuanWhite
2025-08-16 03:01:00
This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔
0
BrianWilliams
2025-08-11 13:00:59
This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔
0
ChristopherThomas
2025-08-07 05:00:59
This is wild! Microsoft’s diving into how specific data shapes AI outputs. Makes me wonder if they’ll start paying people for their data contributions 🤔. Could be a game-changer for fairness in AI!
0
DavidThomas
2025-07-31 19:35:39
This is pretty cool! Microsoft’s dive into crediting AI data contributors could really shake up how we think about AI ethics. Imagine if every meme or tweet that trains a model gets a shoutout! 😄 Curious to see where this goes.
0
DonaldEvans
2025-04-21 07:02:51
माइक्रोसॉफ्ट का AI डेटा कंट्रीब्यूटर्स पर नया प्रोजेक्ट दिलचस्प लगता है, लेकिन मुझे नहीं पता कि यह हम उपयोगकर्ताओं को वास्तव में कैसे लाभ पहुंचाएगा। यह अच्छा है कि वे इस पर शोध कर रहे हैं, लेकिन मुझे उम्मीद है कि यह सिर्फ एक और रिसर्च प्रोजेक्ट नहीं होगा जो खत्म हो जाए। 🤔
0
SamuelRoberts
2025-04-21 03:48:47
O novo projeto da Microsoft sobre contribuintes de dados de IA parece interessante, mas não tenho certeza de como isso realmente nos beneficiará. É legal que eles estejam investigando, mas espero que não seja apenas mais um projeto de pesquisa que não vai pra frente. 🤔
0
微软正在启动一个新的研究项目,旨在了解特定训练示例如何影响生成式AI模型的输出,如文本、图像和其他媒体。此举措在一份12月的招聘广告中被提及,该广告最近在LinkedIn上重新出现,招聘一名研究实习生加入该项目。
该项目的目标是开发一种方法来训练模型,以便“高效且实用地估计”特定数据(如照片和书籍)对其输出的影响。招聘广告指出,当前神经网络架构在追踪输出来源方面缺乏透明度,解决这一问题有充分理由。其中一个原因是为向未来AI模型贡献有价值数据的个人提供激励、认可甚至补偿的潜力。
此研究的背景是涉及AI公司的持续法律争议,包括微软,关于知识产权的争端。AI模型通常在从公共网站抓取的大量数据集上进行训练,其中可能包含受版权保护的材料。虽然AI公司常以合理使用原则寻求保护,但各领域的创作者——艺术家、程序员、作家——对此立场提出异议。
微软目前面临法律挑战,包括《纽约时报》提起的诉讼,指控微软和OpenAI通过使用其文章训练模型侵犯了版权。此外,多名软件开发者因微软的GitHub Copilot AI编码助手使用他们的受版权保护代码提起诉讼。
该研究项目被称为“训练时出处”,由微软研究部门的知名技术专家Jaron Lanier参与。Lanier此前曾撰文讨论“数据尊严”,倡导建立一个系统,将数字内容与其创作者关联,并可能为他们对AI输出的贡献提供补偿。
虽然微软的项目仍处于早期阶段,但Bria、Adobe和Shutterstock等其他公司已在尝试根据数据拥有者对AI模型的贡献进行补偿。然而,大型AI实验室通常未建立个人贡献者支付计划,而是选择许可协议或版权持有者的退出机制,这些机制可能繁琐且范围有限。
微软的举措可能仅停留在概念验证阶段,类似于OpenAI尚未发布的创作者控制其作品如何用于训练数据的工具。还有猜测称,微软可能试图“道德洗白”其AI实践或预先应对监管和法律挑战。
鉴于Google和OpenAI等其他AI实验室最近呼吁美国政府放宽AI开发的版权保护,微软的这一举措尤为引人注目。微软尚未对有关该项目的评论请求作出回应。




This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔




This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔




This is wild! Microsoft’s diving into how specific data shapes AI outputs. Makes me wonder if they’ll start paying people for their data contributions 🤔. Could be a game-changer for fairness in AI!




This is pretty cool! Microsoft’s dive into crediting AI data contributors could really shake up how we think about AI ethics. Imagine if every meme or tweet that trains a model gets a shoutout! 😄 Curious to see where this goes.




माइक्रोसॉफ्ट का AI डेटा कंट्रीब्यूटर्स पर नया प्रोजेक्ट दिलचस्प लगता है, लेकिन मुझे नहीं पता कि यह हम उपयोगकर्ताओं को वास्तव में कैसे लाभ पहुंचाएगा। यह अच्छा है कि वे इस पर शोध कर रहे हैं, लेकिन मुझे उम्मीद है कि यह सिर्फ एक और रिसर्च प्रोजेक्ट नहीं होगा जो खत्म हो जाए। 🤔




O novo projeto da Microsoft sobre contribuintes de dados de IA parece interessante, mas não tenho certeza de como isso realmente nos beneficiará. É legal que eles estejam investigando, mas espero que não seja apenas mais um projeto de pesquisa que não vai pra frente. 🤔












