Microsoft explore les contributeurs de données d'IA de crédits

Microsoft lance un nouveau projet de recherche visant à comprendre comment des exemples d'entraînement spécifiques influencent les sorties des modèles d'IA générative, tels que le texte, les images et autres médias. Cette initiative a été mise en lumière dans une offre d'emploi de décembre, récemment réapparue sur LinkedIn, recherchant un stagiaire de recherche pour rejoindre l'effort.
L'objectif du projet est de développer une méthode pour entraîner les modèles afin que l'impact de données particulières, comme des photos et des livres, sur leurs sorties puisse être "estimé efficacement et utilement". L'offre d'emploi souligne que les architectures actuelles des réseaux neuronaux manquent de transparence pour retracer l'origine de leurs sorties, et il existe des raisons convaincantes de résoudre ce problème. Une raison mentionnée est la possibilité d'offrir des incitations, une reconnaissance, voire une compensation aux individus contribuant des données précieuses aux futurs modèles d'IA.
Ce projet s'inscrit dans le contexte des batailles juridiques en cours impliquant des entreprises d'IA, y compris Microsoft, concernant les droits de propriété intellectuelle. Les modèles d'IA sont souvent entraînés sur de vastes ensembles de données extraits de sites web publics, qui peuvent inclure du matériel sous copyright. Bien que les entreprises d'IA revendiquent souvent la protection sous la doctrine de l'usage équitable, les créateurs de divers domaines — artistes, programmeurs, auteurs — contestent cette position.
Microsoft fait actuellement face à des défis juridiques, y compris une poursuite de The New York Times, qui allègue que Microsoft et OpenAI ont violé ses droits d'auteur en utilisant ses articles pour entraîner leurs modèles. De plus, plusieurs développeurs de logiciels ont poursuivi Microsoft au sujet de son assistant de codage AI GitHub Copilot, affirmant qu'il a été entraîné sur leur code sous copyright.
Le projet de recherche, appelé "provenance à l'entraînement", implique Jaron Lanier, un technologue notable chez Microsoft Research. Lanier a précédemment écrit sur la "dignité des données", plaidant pour un système qui relie le contenu numérique à ses créateurs et les compense potentiellement pour leurs contributions aux sorties d'IA.
Bien que le projet de Microsoft en soit encore à ses débuts, d'autres entreprises comme Bria, Adobe et Shutterstock expérimentent déjà la compensation des propriétaires de données en fonction de leurs contributions aux modèles d'IA. Cependant, les grands laboratoires d'IA n'ont généralement pas établi de programmes de paiement pour les contributeurs individuels, optant plutôt pour des accords de licence ou des mécanismes d'exclusion pour les détenteurs de droits d'auteur, qui peuvent être lourds et limités en portée.
L'initiative de Microsoft pourrait rester une preuve de concept, similaire à l'outil encore non publié d'OpenAI permettant aux créateurs de contrôler l'utilisation de leurs œuvres dans les données d'entraînement. Il y a aussi des spéculations selon lesquelles Microsoft pourrait tenter de "laver l'éthique" de ses pratiques en IA ou d'anticiper les défis réglementaires et juridiques.
Ce mouvement de Microsoft est particulièrement notable étant donné les récents appels d'autres laboratoires d'IA, comme Google et OpenAI, pour que le gouvernement américain assouplisse les protections des droits d'auteur pour le développement de l'IA. Microsoft n'a pas encore répondu aux demandes de commentaires sur ce projet.
Article connexe
Élevez Vos Images avec HitPaw AI Photo Enhancer : Un Guide Complet
Voulez-vous transformer votre expérience d'édition de photos ? Grâce à une intelligence artificielle de pointe, améliorer vos images est désormais sans effort. Ce guide détaillé explore le HitPaw AI P
Création musicale alimentée par l'IA : Créez des chansons et des vidéos sans effort
La création musicale peut être complexe, nécessitant du temps, des ressources et une expertise. L'intelligence artificielle a transformé ce processus, le rendant simple et accessible. Ce guide montre
Création de livres de coloriage alimentés par l'IA : Un guide complet
Concevoir des livres de coloriage est une entreprise gratifiante, combinant expression artistique et expériences apaisantes pour les utilisateurs. Cependant, le processus peut être laborieux. Heureuse
commentaires (34)
0/200
JuanWhite
15 août 2025 21:01:00 UTC+02:00
This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔
0
BrianWilliams
11 août 2025 07:00:59 UTC+02:00
This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔
0
ChristopherThomas
6 août 2025 23:00:59 UTC+02:00
This is wild! Microsoft’s diving into how specific data shapes AI outputs. Makes me wonder if they’ll start paying people for their data contributions 🤔. Could be a game-changer for fairness in AI!
0
DavidThomas
31 juillet 2025 13:35:39 UTC+02:00
This is pretty cool! Microsoft’s dive into crediting AI data contributors could really shake up how we think about AI ethics. Imagine if every meme or tweet that trains a model gets a shoutout! 😄 Curious to see where this goes.
0
DonaldEvans
21 avril 2025 01:02:51 UTC+02:00
माइक्रोसॉफ्ट का AI डेटा कंट्रीब्यूटर्स पर नया प्रोजेक्ट दिलचस्प लगता है, लेकिन मुझे नहीं पता कि यह हम उपयोगकर्ताओं को वास्तव में कैसे लाभ पहुंचाएगा। यह अच्छा है कि वे इस पर शोध कर रहे हैं, लेकिन मुझे उम्मीद है कि यह सिर्फ एक और रिसर्च प्रोजेक्ट नहीं होगा जो खत्म हो जाए। 🤔
0
SamuelRoberts
20 avril 2025 21:48:47 UTC+02:00
O novo projeto da Microsoft sobre contribuintes de dados de IA parece interessante, mas não tenho certeza de como isso realmente nos beneficiará. É legal que eles estejam investigando, mas espero que não seja apenas mais um projeto de pesquisa que não vai pra frente. 🤔
0
Microsoft lance un nouveau projet de recherche visant à comprendre comment des exemples d'entraînement spécifiques influencent les sorties des modèles d'IA générative, tels que le texte, les images et autres médias. Cette initiative a été mise en lumière dans une offre d'emploi de décembre, récemment réapparue sur LinkedIn, recherchant un stagiaire de recherche pour rejoindre l'effort.
L'objectif du projet est de développer une méthode pour entraîner les modèles afin que l'impact de données particulières, comme des photos et des livres, sur leurs sorties puisse être "estimé efficacement et utilement". L'offre d'emploi souligne que les architectures actuelles des réseaux neuronaux manquent de transparence pour retracer l'origine de leurs sorties, et il existe des raisons convaincantes de résoudre ce problème. Une raison mentionnée est la possibilité d'offrir des incitations, une reconnaissance, voire une compensation aux individus contribuant des données précieuses aux futurs modèles d'IA.
Ce projet s'inscrit dans le contexte des batailles juridiques en cours impliquant des entreprises d'IA, y compris Microsoft, concernant les droits de propriété intellectuelle. Les modèles d'IA sont souvent entraînés sur de vastes ensembles de données extraits de sites web publics, qui peuvent inclure du matériel sous copyright. Bien que les entreprises d'IA revendiquent souvent la protection sous la doctrine de l'usage équitable, les créateurs de divers domaines — artistes, programmeurs, auteurs — contestent cette position.
Microsoft fait actuellement face à des défis juridiques, y compris une poursuite de The New York Times, qui allègue que Microsoft et OpenAI ont violé ses droits d'auteur en utilisant ses articles pour entraîner leurs modèles. De plus, plusieurs développeurs de logiciels ont poursuivi Microsoft au sujet de son assistant de codage AI GitHub Copilot, affirmant qu'il a été entraîné sur leur code sous copyright.
Le projet de recherche, appelé "provenance à l'entraînement", implique Jaron Lanier, un technologue notable chez Microsoft Research. Lanier a précédemment écrit sur la "dignité des données", plaidant pour un système qui relie le contenu numérique à ses créateurs et les compense potentiellement pour leurs contributions aux sorties d'IA.
Bien que le projet de Microsoft en soit encore à ses débuts, d'autres entreprises comme Bria, Adobe et Shutterstock expérimentent déjà la compensation des propriétaires de données en fonction de leurs contributions aux modèles d'IA. Cependant, les grands laboratoires d'IA n'ont généralement pas établi de programmes de paiement pour les contributeurs individuels, optant plutôt pour des accords de licence ou des mécanismes d'exclusion pour les détenteurs de droits d'auteur, qui peuvent être lourds et limités en portée.
L'initiative de Microsoft pourrait rester une preuve de concept, similaire à l'outil encore non publié d'OpenAI permettant aux créateurs de contrôler l'utilisation de leurs œuvres dans les données d'entraînement. Il y a aussi des spéculations selon lesquelles Microsoft pourrait tenter de "laver l'éthique" de ses pratiques en IA ou d'anticiper les défis réglementaires et juridiques.
Ce mouvement de Microsoft est particulièrement notable étant donné les récents appels d'autres laboratoires d'IA, comme Google et OpenAI, pour que le gouvernement américain assouplisse les protections des droits d'auteur pour le développement de l'IA. Microsoft n'a pas encore répondu aux demandes de commentaires sur ce projet.




This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔




This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔




This is wild! Microsoft’s diving into how specific data shapes AI outputs. Makes me wonder if they’ll start paying people for their data contributions 🤔. Could be a game-changer for fairness in AI!




This is pretty cool! Microsoft’s dive into crediting AI data contributors could really shake up how we think about AI ethics. Imagine if every meme or tweet that trains a model gets a shoutout! 😄 Curious to see where this goes.




माइक्रोसॉफ्ट का AI डेटा कंट्रीब्यूटर्स पर नया प्रोजेक्ट दिलचस्प लगता है, लेकिन मुझे नहीं पता कि यह हम उपयोगकर्ताओं को वास्तव में कैसे लाभ पहुंचाएगा। यह अच्छा है कि वे इस पर शोध कर रहे हैं, लेकिन मुझे उम्मीद है कि यह सिर्फ एक और रिसर्च प्रोजेक्ट नहीं होगा जो खत्म हो जाए। 🤔




O novo projeto da Microsoft sobre contribuintes de dados de IA parece interessante, mas não tenho certeza de como isso realmente nos beneficiará. É legal que eles estejam investigando, mas espero que não seja apenas mais um projeto de pesquisa que não vai pra frente. 🤔












