Microsoft explora acreditar a los contribuyentes de datos de IA

Hogar

Noticias

10 de abril de 2025

NicholasLewis

191

Microsoft explora acreditar a los contribuyentes de datos de IA

Microsoft está iniciando un nuevo proyecto de investigación destinado a comprender cómo ejemplos de entrenamiento específicos influyen en los resultados de modelos de IA generativa, como texto, imágenes y otros medios. Esta iniciativa se destacó en una oferta de empleo de diciembre que recientemente resurgió en LinkedIn, buscando un interno de investigación para unirse al esfuerzo.

El objetivo del proyecto es desarrollar un método para entrenar modelos de modo que el impacto de datos particulares, como fotos y libros, en sus resultados pueda ser "estimado de manera eficiente y útil". La oferta de empleo señala que las arquitecturas actuales de redes neuronales carecen de transparencia para rastrear los orígenes de sus resultados, y hay razones convincentes para abordar este problema. Una razón mencionada es la posibilidad de ofrecer incentivos, reconocimiento e incluso compensación a individuos que aporten datos valiosos a futuros modelos de IA.

El trasfondo de esta investigación son las batallas legales en curso que involucran a empresas de IA, incluido Microsoft, sobre derechos de propiedad intelectual. Los modelos de IA a menudo se entrenan con vastos conjuntos de datos extraídos de sitios web públicos, que pueden incluir material protegido por derechos de autor. Mientras las empresas de IA suelen reclamar protección bajo la doctrina de uso justo, creadores de diversos campos—artistas, programadores, autores—cuestionan esta postura.

Microsoft enfrenta actualmente desafíos legales, incluida una demanda de The New York Times, que alega que Microsoft y OpenAI infringieron sus derechos de autor al usar sus artículos para entrenar sus modelos. Además, varios desarrolladores de software han demandado a Microsoft por su asistente de codificación GitHub Copilot AI, alegando que fue entrenado con su código protegido por derechos de autor.

El proyecto de investigación, denominado "training-time provenance", involucra a Jaron Lanier, un destacado tecnólogo en Microsoft Research. Lanier ha escrito previamente sobre "data dignity", abogando por un sistema que conecte el contenido digital con sus creadores y potencialmente los compense por sus contribuciones a los resultados de IA.

Aunque el proyecto de Microsoft está en sus primeras etapas, otras empresas como Bria, Adobe y Shutterstock ya están experimentando con la compensación a propietarios de datos basada en sus contribuciones a modelos de IA. Sin embargo, los grandes laboratorios de IA generalmente no han establecido programas de pago para colaboradores individuales, optando en cambio por acuerdos de licencia o mecanismos de exclusión para titulares de derechos de autor, que pueden ser engorrosos y limitados en alcance.

La iniciativa de Microsoft podría permanecer como una prueba de concepto, similar a la herramienta aún no lanzada de OpenAI para que los creadores controlen cómo se usan sus obras en los datos de entrenamiento. También hay especulaciones de que Microsoft podría estar intentando "lavar éticamente" sus prácticas de IA o anticiparse a desafíos regulatorios y legales.

Este movimiento de Microsoft es particularmente notable dado los recientes llamados de otros laboratorios de IA, como Google y OpenAI, para que el gobierno de EE. UU. relaje las protecciones de derechos de autor para el desarrollo de IA. Microsoft aún no ha respondido a solicitudes de comentarios sobre este proyecto.

Artículo relacionado

Maestro Esmeralda Kaizo Nuzlocke: Guía definitiva de supervivencia y estrategia Kaizo Esmeralda se erige como uno de los hacks de ROMs de Pokémon más formidables jamás concebidos. Aunque intentar una ejecución Nuzlocke aumenta exponencialmente el desafío, la victoria sigue siendo

Cartas de presentación con IA: Guía de expertos para la presentación de trabajos a revistas En el competitivo entorno actual de las publicaciones académicas, la elaboración de una carta de presentación eficaz puede marcar la diferencia decisiva en la aceptación de su manuscrito. Descubra cóm

EE.UU. sancionará a funcionarios extranjeros por la normativa sobre redes sociales EE.UU. se posiciona contra la regulación mundial de contenidos digitalesEl Departamento de Estado ha lanzado esta semana una dura reprimenda diplomática contra las políticas europeas de gobernanza d

comentario (34)

0/200

Entregar

JuanWhite

15 de agosto de 2025 21:01:00 GMT+02:00

This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔

BrianWilliams

11 de agosto de 2025 07:00:59 GMT+02:00

This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔

ChristopherThomas

6 de agosto de 2025 23:00:59 GMT+02:00

This is wild! Microsoft’s diving into how specific data shapes AI outputs. Makes me wonder if they’ll start paying people for their data contributions 🤔. Could be a game-changer for fairness in AI!

DavidThomas

31 de julio de 2025 13:35:39 GMT+02:00

This is pretty cool! Microsoft’s dive into crediting AI data contributors could really shake up how we think about AI ethics. Imagine if every meme or tweet that trains a model gets a shoutout! 😄 Curious to see where this goes.

DonaldEvans

21 de abril de 2025 01:02:51 GMT+02:00

माइक्रोसॉफ्ट का AI डेटा कंट्रीब्यूटर्स पर नया प्रोजेक्ट दिलचस्प लगता है, लेकिन मुझे नहीं पता कि यह हम उपयोगकर्ताओं को वास्तव में कैसे लाभ पहुंचाएगा। यह अच्छा है कि वे इस पर शोध कर रहे हैं, लेकिन मुझे उम्मीद है कि यह सिर्फ एक और रिसर्च प्रोजेक्ट नहीं होगा जो खत्म हो जाए। 🤔

SamuelRoberts

20 de abril de 2025 21:48:47 GMT+02:00

O novo projeto da Microsoft sobre contribuintes de dados de IA parece interessante, mas não tenho certeza de como isso realmente nos beneficiará. É legal que eles estejam investigando, mas espero que não seja apenas mais um projeto de pesquisa que não vai pra frente. 🤔

Noticias principales

Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Gemini 2.5 Pro ahora ilimitado y más barato que Claude, GPT-4O Doblaje AI: Guía Definitiva para la Creación de Voz Realista La IA de Cambium transforma la madera de los desechos en madera AI Builder y Power Automate Revolucionan la Sumarización de Documentos Operai mejora el asistente de voz de IA para mejores chats Cómo garantizar que sus datos sean confiables para la integración de IA Notebooklm se expande a nivel mundial, agrega diapositivas y verificación de hechos mejorada Los ajustes a los centros de datos de EE. UU. Podrían desbloquear 76 GW de nueva capacidad de potencia Google utiliza IA para suspender más de 39 millones de cuentas publicitarias por sospecha de fraude

Más

Presentado