Microsoft探索了信用AI数据贡献者

微软正在启动一个新的研究项目,旨在了解特定训练示例如何影响生成式AI模型的输出,如文本、图像和其他媒体。此举措在一份12月的招聘广告中被提及,该广告最近在LinkedIn上重新出现,招聘一名研究实习生加入该项目。
该项目的目标是开发一种方法来训练模型,以便“高效且实用地估计”特定数据(如照片和书籍)对其输出的影响。招聘广告指出,当前神经网络架构在追踪输出来源方面缺乏透明度,解决这一问题有充分理由。其中一个原因是为向未来AI模型贡献有价值数据的个人提供激励、认可甚至补偿的潜力。
此研究的背景是涉及AI公司的持续法律争议,包括微软,关于知识产权的争端。AI模型通常在从公共网站抓取的大量数据集上进行训练,其中可能包含受版权保护的材料。虽然AI公司常以合理使用原则寻求保护,但各领域的创作者——艺术家、程序员、作家——对此立场提出异议。
微软目前面临法律挑战,包括《纽约时报》提起的诉讼,指控微软和OpenAI通过使用其文章训练模型侵犯了版权。此外,多名软件开发者因微软的GitHub Copilot AI编码助手使用他们的受版权保护代码提起诉讼。
该研究项目被称为“训练时出处”,由微软研究部门的知名技术专家Jaron Lanier参与。Lanier此前曾撰文讨论“数据尊严”,倡导建立一个系统,将数字内容与其创作者关联,并可能为他们对AI输出的贡献提供补偿。
虽然微软的项目仍处于早期阶段,但Bria、Adobe和Shutterstock等其他公司已在尝试根据数据拥有者对AI模型的贡献进行补偿。然而,大型AI实验室通常未建立个人贡献者支付计划,而是选择许可协议或版权持有者的退出机制,这些机制可能繁琐且范围有限。
微软的举措可能仅停留在概念验证阶段,类似于OpenAI尚未发布的创作者控制其作品如何用于训练数据的工具。还有猜测称,微软可能试图“道德洗白”其AI实践或预先应对监管和法律挑战。
鉴于Google和OpenAI等其他AI实验室最近呼吁美国政府放宽AI开发的版权保护,微软的这一举措尤为引人注目。微软尚未对有关该项目的评论请求作出回应。
相关文章
中国电信投资面壁智能,为大型语言模型及数据基础设施筹集71.3万元资金
在大模型领域,这支“国家队”与来自清华大学的领军人物正在深化战略合作。据企查查最新企业注册数据显示,2026年3月1日,北京面壁智能科技有限公司进行了重大股权重组,正式引入了电信巨头和行业基金的投资。这一转变不仅关乎资金注入——更预示着国内大模型在公共数据平台及智能硬件领域的商业化进程将大幅提速。核心亮点:电信巨头与本土基金的双重背书此次股权变更后,面壁智能的股东结构迎来了数家重要新成员:中国电信
陶天集团加速推进AI原生转型,向实习生发放免费代币配额
陶天集团近期推出了“AI生产力计划”,旨在通过资源配置和工具补贴,加速将AI技术融入电商运营及研发工作流程。该计划现已向所有实习生开放,使其在实习期间享有与正式员工同等的AI权限、计算配额及审批流程。自3月17日起,淘天集团员工已获授权免费使用多款付费AI工具,包括悟空和Qoder系列。这些工具支持从基础技术研发到日常办公效率提升等广泛应用场景。 通过直接提供Token配额,公司降低了使用大型语言
Glean瞄准企业级AI基础设施市场,展开抢占先机之战
争夺企业人工智能主导权的竞争正在加速。微软正将 Copilot 嵌入 Office,谷歌则将 Gemini 整合到 Workspace 中,而 OpenAI 和 Anthropic 都在直接向企业销售产品。与此同时,如今几乎每家 SaaS 供应商都配备了人工智能助手。在各方争相掌控用户界面的热潮中,Glean却采取了一种更低调的策略:成为底层的智能架构。七年前,Glean以“职场版谷歌”的定位起家
相关专题推荐
评论 (37)
0/500
Interesante proyecto, pero lo que realmente necesito es que alguien en la IA me explique por qué mi asistente virtual aún no puede organizarme el escritorio 😅. ¿Esto de la atribución podría cambiar cómo las empresas comparten datos? Me preocupa un poco la transparencia de todo el proceso. Ojalá no sea solo un gesto de relaciones públicas.
Lo de Microsoft parece interesante pero, ¿y la privacidad de los datos? 🤔 A veces siento que con toda esta exploración de IA, estamos perdiendo el control de lo que se usa para entrenar los modelos. ¿Habrá una compensación justa para quienes contribuyeron? No quiero que esto se convierta en otro caso de 'big tech' aprovechándose de 'datos gratis'...
이런 연구는 AI 데이터 기여자들에게 공정한 보상을 제공하는 데 중요한 단계가 될 수 있겠네요. 😊 근데 MS가 과연 저작권 문제를 해결할 수 있을지 의문이 드네요. 데이터 소싱 방식이 좀 더 투명해져야 할 시점인 것 같아요!
This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔
This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔

微软正在启动一个新的研究项目,旨在了解特定训练示例如何影响生成式AI模型的输出,如文本、图像和其他媒体。此举措在一份12月的招聘广告中被提及,该广告最近在LinkedIn上重新出现,招聘一名研究实习生加入该项目。
该项目的目标是开发一种方法来训练模型,以便“高效且实用地估计”特定数据(如照片和书籍)对其输出的影响。招聘广告指出,当前神经网络架构在追踪输出来源方面缺乏透明度,解决这一问题有充分理由。其中一个原因是为向未来AI模型贡献有价值数据的个人提供激励、认可甚至补偿的潜力。
此研究的背景是涉及AI公司的持续法律争议,包括微软,关于知识产权的争端。AI模型通常在从公共网站抓取的大量数据集上进行训练,其中可能包含受版权保护的材料。虽然AI公司常以合理使用原则寻求保护,但各领域的创作者——艺术家、程序员、作家——对此立场提出异议。
微软目前面临法律挑战,包括《纽约时报》提起的诉讼,指控微软和OpenAI通过使用其文章训练模型侵犯了版权。此外,多名软件开发者因微软的GitHub Copilot AI编码助手使用他们的受版权保护代码提起诉讼。
该研究项目被称为“训练时出处”,由微软研究部门的知名技术专家Jaron Lanier参与。Lanier此前曾撰文讨论“数据尊严”,倡导建立一个系统,将数字内容与其创作者关联,并可能为他们对AI输出的贡献提供补偿。
虽然微软的项目仍处于早期阶段,但Bria、Adobe和Shutterstock等其他公司已在尝试根据数据拥有者对AI模型的贡献进行补偿。然而,大型AI实验室通常未建立个人贡献者支付计划,而是选择许可协议或版权持有者的退出机制,这些机制可能繁琐且范围有限。
微软的举措可能仅停留在概念验证阶段,类似于OpenAI尚未发布的创作者控制其作品如何用于训练数据的工具。还有猜测称,微软可能试图“道德洗白”其AI实践或预先应对监管和法律挑战。
鉴于Google和OpenAI等其他AI实验室最近呼吁美国政府放宽AI开发的版权保护,微软的这一举措尤为引人注目。微软尚未对有关该项目的评论请求作出回应。
中国电信投资面壁智能,为大型语言模型及数据基础设施筹集71.3万元资金
在大模型领域,这支“国家队”与来自清华大学的领军人物正在深化战略合作。据企查查最新企业注册数据显示,2026年3月1日,北京面壁智能科技有限公司进行了重大股权重组,正式引入了电信巨头和行业基金的投资。这一转变不仅关乎资金注入——更预示着国内大模型在公共数据平台及智能硬件领域的商业化进程将大幅提速。核心亮点:电信巨头与本土基金的双重背书此次股权变更后,面壁智能的股东结构迎来了数家重要新成员:中国电信
陶天集团加速推进AI原生转型,向实习生发放免费代币配额
陶天集团近期推出了“AI生产力计划”,旨在通过资源配置和工具补贴,加速将AI技术融入电商运营及研发工作流程。该计划现已向所有实习生开放,使其在实习期间享有与正式员工同等的AI权限、计算配额及审批流程。自3月17日起,淘天集团员工已获授权免费使用多款付费AI工具,包括悟空和Qoder系列。这些工具支持从基础技术研发到日常办公效率提升等广泛应用场景。 通过直接提供Token配额,公司降低了使用大型语言
Glean瞄准企业级AI基础设施市场,展开抢占先机之战
争夺企业人工智能主导权的竞争正在加速。微软正将 Copilot 嵌入 Office,谷歌则将 Gemini 整合到 Workspace 中,而 OpenAI 和 Anthropic 都在直接向企业销售产品。与此同时,如今几乎每家 SaaS 供应商都配备了人工智能助手。在各方争相掌控用户界面的热潮中,Glean却采取了一种更低调的策略:成为底层的智能架构。七年前,Glean以“职场版谷歌”的定位起家
Interesante proyecto, pero lo que realmente necesito es que alguien en la IA me explique por qué mi asistente virtual aún no puede organizarme el escritorio 😅. ¿Esto de la atribución podría cambiar cómo las empresas comparten datos? Me preocupa un poco la transparencia de todo el proceso. Ojalá no sea solo un gesto de relaciones públicas.
Lo de Microsoft parece interesante pero, ¿y la privacidad de los datos? 🤔 A veces siento que con toda esta exploración de IA, estamos perdiendo el control de lo que se usa para entrenar los modelos. ¿Habrá una compensación justa para quienes contribuyeron? No quiero que esto se convierta en otro caso de 'big tech' aprovechándose de 'datos gratis'...
이런 연구는 AI 데이터 기여자들에게 공정한 보상을 제공하는 데 중요한 단계가 될 수 있겠네요. 😊 근데 MS가 과연 저작권 문제를 해결할 수 있을지 의문이 드네요. 데이터 소싱 방식이 좀 더 투명해져야 할 시점인 것 같아요!
This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔
This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔





首页






