Microsoft explora acreditar a los contribuyentes de datos de IA

Microsoft está iniciando un nuevo proyecto de investigación destinado a comprender cómo ejemplos de entrenamiento específicos influyen en los resultados de modelos de IA generativa, como texto, imágenes y otros medios. Esta iniciativa se destacó en una oferta de empleo de diciembre que recientemente resurgió en LinkedIn, buscando un interno de investigación para unirse al esfuerzo.
El objetivo del proyecto es desarrollar un método para entrenar modelos de modo que el impacto de datos particulares, como fotos y libros, en sus resultados pueda ser "estimado de manera eficiente y útil". La oferta de empleo señala que las arquitecturas actuales de redes neuronales carecen de transparencia para rastrear los orígenes de sus resultados, y hay razones convincentes para abordar este problema. Una razón mencionada es la posibilidad de ofrecer incentivos, reconocimiento e incluso compensación a individuos que aporten datos valiosos a futuros modelos de IA.
El trasfondo de esta investigación son las batallas legales en curso que involucran a empresas de IA, incluido Microsoft, sobre derechos de propiedad intelectual. Los modelos de IA a menudo se entrenan con vastos conjuntos de datos extraídos de sitios web públicos, que pueden incluir material protegido por derechos de autor. Mientras las empresas de IA suelen reclamar protección bajo la doctrina de uso justo, creadores de diversos campos—artistas, programadores, autores—cuestionan esta postura.
Microsoft enfrenta actualmente desafíos legales, incluida una demanda de The New York Times, que alega que Microsoft y OpenAI infringieron sus derechos de autor al usar sus artículos para entrenar sus modelos. Además, varios desarrolladores de software han demandado a Microsoft por su asistente de codificación GitHub Copilot AI, alegando que fue entrenado con su código protegido por derechos de autor.
El proyecto de investigación, denominado "training-time provenance", involucra a Jaron Lanier, un destacado tecnólogo en Microsoft Research. Lanier ha escrito previamente sobre "data dignity", abogando por un sistema que conecte el contenido digital con sus creadores y potencialmente los compense por sus contribuciones a los resultados de IA.
Aunque el proyecto de Microsoft está en sus primeras etapas, otras empresas como Bria, Adobe y Shutterstock ya están experimentando con la compensación a propietarios de datos basada en sus contribuciones a modelos de IA. Sin embargo, los grandes laboratorios de IA generalmente no han establecido programas de pago para colaboradores individuales, optando en cambio por acuerdos de licencia o mecanismos de exclusión para titulares de derechos de autor, que pueden ser engorrosos y limitados en alcance.
La iniciativa de Microsoft podría permanecer como una prueba de concepto, similar a la herramienta aún no lanzada de OpenAI para que los creadores controlen cómo se usan sus obras en los datos de entrenamiento. También hay especulaciones de que Microsoft podría estar intentando "lavar éticamente" sus prácticas de IA o anticiparse a desafíos regulatorios y legales.
Este movimiento de Microsoft es particularmente notable dado los recientes llamados de otros laboratorios de IA, como Google y OpenAI, para que el gobierno de EE. UU. relaje las protecciones de derechos de autor para el desarrollo de IA. Microsoft aún no ha respondido a solicitudes de comentarios sobre este proyecto.
Artículo relacionado
Qodo se asocia con Google Cloud para ofrecer herramientas gratuitas de revisión de código de IA para desarrolladores
Qodo, una startup de codificación de IA con sede en Israel enfocada en la calidad del código, ha iniciado una asociación con Google Cloud para mejorar la integridad del software generado por IA.A medi
El AI de DeepMind Gana Oro en la Olimpiada de Matemáticas 2025
El AI de DeepMind ha logrado un avance impresionante en razonamiento matemático, obteniendo una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) 2025, solo un año después de ganar pla
Creador de Paralaje Potenciado por IA: Crea Animaciones Dinámicas 2.5D
Transforma imágenes estáticas en animaciones 2.5D cautivadoras con Parallax Maker. Esta herramienta de código abierto permite a artistas y desarrolladores de juegos añadir profundidad y movimiento a s
comentario (34)
0/200
JuanWhite
15 de agosto de 2025 21:01:00 GMT+02:00
This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔
0
BrianWilliams
11 de agosto de 2025 07:00:59 GMT+02:00
This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔
0
ChristopherThomas
6 de agosto de 2025 23:00:59 GMT+02:00
This is wild! Microsoft’s diving into how specific data shapes AI outputs. Makes me wonder if they’ll start paying people for their data contributions 🤔. Could be a game-changer for fairness in AI!
0
DavidThomas
31 de julio de 2025 13:35:39 GMT+02:00
This is pretty cool! Microsoft’s dive into crediting AI data contributors could really shake up how we think about AI ethics. Imagine if every meme or tweet that trains a model gets a shoutout! 😄 Curious to see where this goes.
0
DonaldEvans
21 de abril de 2025 01:02:51 GMT+02:00
माइक्रोसॉफ्ट का AI डेटा कंट्रीब्यूटर्स पर नया प्रोजेक्ट दिलचस्प लगता है, लेकिन मुझे नहीं पता कि यह हम उपयोगकर्ताओं को वास्तव में कैसे लाभ पहुंचाएगा। यह अच्छा है कि वे इस पर शोध कर रहे हैं, लेकिन मुझे उम्मीद है कि यह सिर्फ एक और रिसर्च प्रोजेक्ट नहीं होगा जो खत्म हो जाए। 🤔
0
SamuelRoberts
20 de abril de 2025 21:48:47 GMT+02:00
O novo projeto da Microsoft sobre contribuintes de dados de IA parece interessante, mas não tenho certeza de como isso realmente nos beneficiará. É legal que eles estejam investigando, mas espero que não seja apenas mais um projeto de pesquisa que não vai pra frente. 🤔
0
Microsoft está iniciando un nuevo proyecto de investigación destinado a comprender cómo ejemplos de entrenamiento específicos influyen en los resultados de modelos de IA generativa, como texto, imágenes y otros medios. Esta iniciativa se destacó en una oferta de empleo de diciembre que recientemente resurgió en LinkedIn, buscando un interno de investigación para unirse al esfuerzo.
El objetivo del proyecto es desarrollar un método para entrenar modelos de modo que el impacto de datos particulares, como fotos y libros, en sus resultados pueda ser "estimado de manera eficiente y útil". La oferta de empleo señala que las arquitecturas actuales de redes neuronales carecen de transparencia para rastrear los orígenes de sus resultados, y hay razones convincentes para abordar este problema. Una razón mencionada es la posibilidad de ofrecer incentivos, reconocimiento e incluso compensación a individuos que aporten datos valiosos a futuros modelos de IA.
El trasfondo de esta investigación son las batallas legales en curso que involucran a empresas de IA, incluido Microsoft, sobre derechos de propiedad intelectual. Los modelos de IA a menudo se entrenan con vastos conjuntos de datos extraídos de sitios web públicos, que pueden incluir material protegido por derechos de autor. Mientras las empresas de IA suelen reclamar protección bajo la doctrina de uso justo, creadores de diversos campos—artistas, programadores, autores—cuestionan esta postura.
Microsoft enfrenta actualmente desafíos legales, incluida una demanda de The New York Times, que alega que Microsoft y OpenAI infringieron sus derechos de autor al usar sus artículos para entrenar sus modelos. Además, varios desarrolladores de software han demandado a Microsoft por su asistente de codificación GitHub Copilot AI, alegando que fue entrenado con su código protegido por derechos de autor.
El proyecto de investigación, denominado "training-time provenance", involucra a Jaron Lanier, un destacado tecnólogo en Microsoft Research. Lanier ha escrito previamente sobre "data dignity", abogando por un sistema que conecte el contenido digital con sus creadores y potencialmente los compense por sus contribuciones a los resultados de IA.
Aunque el proyecto de Microsoft está en sus primeras etapas, otras empresas como Bria, Adobe y Shutterstock ya están experimentando con la compensación a propietarios de datos basada en sus contribuciones a modelos de IA. Sin embargo, los grandes laboratorios de IA generalmente no han establecido programas de pago para colaboradores individuales, optando en cambio por acuerdos de licencia o mecanismos de exclusión para titulares de derechos de autor, que pueden ser engorrosos y limitados en alcance.
La iniciativa de Microsoft podría permanecer como una prueba de concepto, similar a la herramienta aún no lanzada de OpenAI para que los creadores controlen cómo se usan sus obras en los datos de entrenamiento. También hay especulaciones de que Microsoft podría estar intentando "lavar éticamente" sus prácticas de IA o anticiparse a desafíos regulatorios y legales.
Este movimiento de Microsoft es particularmente notable dado los recientes llamados de otros laboratorios de IA, como Google y OpenAI, para que el gobierno de EE. UU. relaje las protecciones de derechos de autor para el desarrollo de IA. Microsoft aún no ha respondido a solicitudes de comentarios sobre este proyecto.



This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔




This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔




This is wild! Microsoft’s diving into how specific data shapes AI outputs. Makes me wonder if they’ll start paying people for their data contributions 🤔. Could be a game-changer for fairness in AI!




This is pretty cool! Microsoft’s dive into crediting AI data contributors could really shake up how we think about AI ethics. Imagine if every meme or tweet that trains a model gets a shoutout! 😄 Curious to see where this goes.




माइक्रोसॉफ्ट का AI डेटा कंट्रीब्यूटर्स पर नया प्रोजेक्ट दिलचस्प लगता है, लेकिन मुझे नहीं पता कि यह हम उपयोगकर्ताओं को वास्तव में कैसे लाभ पहुंचाएगा। यह अच्छा है कि वे इस पर शोध कर रहे हैं, लेकिन मुझे उम्मीद है कि यह सिर्फ एक और रिसर्च प्रोजेक्ट नहीं होगा जो खत्म हो जाए। 🤔




O novo projeto da Microsoft sobre contribuintes de dados de IA parece interessante, mas não tenho certeza de como isso realmente nos beneficiará. É legal que eles estejam investigando, mas espero que não seja apenas mais um projeto de pesquisa que não vai pra frente. 🤔












