Microsoft explora que os contribuintes de dados da IA

A Microsoft está iniciando um novo projeto de pesquisa com o objetivo de entender como exemplos de treinamento específicos influenciam os resultados de modelos de IA generativa, como textos, imagens e outros meios. Esta iniciativa foi destacada em uma vaga de emprego de dezembro que recentemente ressurgiu no LinkedIn, buscando um estagiário de pesquisa para se juntar ao esforço.
O objetivo do projeto é desenvolver um método para treinar modelos de modo que o impacto de dados específicos, como fotos e livros, em seus resultados possa ser "eficientemente e utilmente estimado." A vaga aponta que as atuais arquiteturas de redes neurais carecem de transparência ao rastrear as origens de seus resultados, e há razões convincentes para abordar essa questão. Uma razão mencionada é o potencial para oferecer incentivos, reconhecimento e até compensação a indivíduos que contribuem com dados valiosos para futuros modelos de IA.
O pano de fundo desta pesquisa são as batalhas legais em curso envolvendo empresas de IA, incluindo a Microsoft, sobre direitos de propriedade intelectual. Modelos de IA são frequentemente treinados em vastos conjuntos de dados extraídos de sites públicos, que podem incluir material protegido por direitos autorais. Embora as empresas de IA frequentemente reivindiquem proteção sob a doutrina do uso justo, criadores de diversos campos — artistas, programadores, autores — contestam essa posição.
A Microsoft está atualmente enfrentando desafios legais, incluindo um processo do The New York Times, que alega que a Microsoft e a OpenAI violaram seus direitos autorais ao usar seus artigos para treinar seus modelos. Além disso, vários desenvolvedores de software processaram a Microsoft por causa de seu assistente de codificação GitHub Copilot AI, alegando que ele foi treinado com seu código protegido por direitos autorais.
O projeto de pesquisa, referido como "proveniência em tempo de treinamento," envolve Jaron Lanier, um notável tecnólogo da Microsoft Research. Lanier já escreveu sobre "dignidade de dados," defendendo um sistema que conecte conteúdo digital aos seus criadores e potencialmente os compense por suas contribuições aos resultados de IA.
Embora o projeto da Microsoft ainda esteja em seus estágios iniciais, outras empresas como Bria, Adobe e Shutterstock já estão experimentando compensar proprietários de dados com base em suas contribuições para modelos de IA. No entanto, grandes laboratórios de IA geralmente não estabeleceram programas de pagamento para contribuidores individuais, optando por acordos de licenciamento ou mecanismos de exclusão para detentores de direitos autorais, que podem ser complicados e limitados em alcance.
A iniciativa da Microsoft pode permanecer como uma prova de conceito, semelhante à ferramenta ainda não lançada da OpenAI para criadores controlarem como suas obras são usadas em dados de treinamento. Há também especulações de que a Microsoft pode estar tentando "lavar" eticamente suas práticas de IA ou antecipar desafios regulatórios e legais.
Essa movimentação da Microsoft é particularmente notável dado os recentes apelos de outros laboratórios de IA, como Google e OpenAI, para que o governo dos EUA relaxe as proteções de direitos autorais para o desenvolvimento de IA. A Microsoft ainda não respondeu a pedidos de comentários sobre este projeto.
Artigo relacionado
Qodo Faz Parceria com Google Cloud para Oferecer Ferramentas Gratuitas de Revisão de Código por IA para Desenvolvedores
Qodo, uma startup de codificação por IA baseada em Israel focada em qualidade de código, lançou uma parceria com Google Cloud para aprimorar a integridade de software gerado por IA.À medida que as emp
IA da DeepMind Ganha Ouro na Olimpíada de Matemática de 2025
A IA da DeepMind alcançou um salto impressionante no raciocínio matemático, conquistando uma medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025, apenas um ano após ganhar prata em
Criador de Paralaxe Alimentado por IA: Crie Animações 2.5D Dinâmicas
Transforme imagens estáticas em animações 2.5D cativantes com o Parallax Maker. Esta ferramenta de código aberto capacita artistas e desenvolvedores de jogos a adicionar profundidade e movimento ao se
Comentários (34)
0/200
JuanWhite
15 de Agosto de 2025 à0 20:01:00 WEST
This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔
0
BrianWilliams
11 de Agosto de 2025 à59 06:00:59 WEST
This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔
0
ChristopherThomas
6 de Agosto de 2025 à59 22:00:59 WEST
This is wild! Microsoft’s diving into how specific data shapes AI outputs. Makes me wonder if they’ll start paying people for their data contributions 🤔. Could be a game-changer for fairness in AI!
0
DavidThomas
31 de Julho de 2025 à39 12:35:39 WEST
This is pretty cool! Microsoft’s dive into crediting AI data contributors could really shake up how we think about AI ethics. Imagine if every meme or tweet that trains a model gets a shoutout! 😄 Curious to see where this goes.
0
DonaldEvans
21 de Abril de 2025 à51 00:02:51 WEST
माइक्रोसॉफ्ट का AI डेटा कंट्रीब्यूटर्स पर नया प्रोजेक्ट दिलचस्प लगता है, लेकिन मुझे नहीं पता कि यह हम उपयोगकर्ताओं को वास्तव में कैसे लाभ पहुंचाएगा। यह अच्छा है कि वे इस पर शोध कर रहे हैं, लेकिन मुझे उम्मीद है कि यह सिर्फ एक और रिसर्च प्रोजेक्ट नहीं होगा जो खत्म हो जाए। 🤔
0
SamuelRoberts
20 de Abril de 2025 à47 20:48:47 WEST
O novo projeto da Microsoft sobre contribuintes de dados de IA parece interessante, mas não tenho certeza de como isso realmente nos beneficiará. É legal que eles estejam investigando, mas espero que não seja apenas mais um projeto de pesquisa que não vai pra frente. 🤔
0
A Microsoft está iniciando um novo projeto de pesquisa com o objetivo de entender como exemplos de treinamento específicos influenciam os resultados de modelos de IA generativa, como textos, imagens e outros meios. Esta iniciativa foi destacada em uma vaga de emprego de dezembro que recentemente ressurgiu no LinkedIn, buscando um estagiário de pesquisa para se juntar ao esforço.
O objetivo do projeto é desenvolver um método para treinar modelos de modo que o impacto de dados específicos, como fotos e livros, em seus resultados possa ser "eficientemente e utilmente estimado." A vaga aponta que as atuais arquiteturas de redes neurais carecem de transparência ao rastrear as origens de seus resultados, e há razões convincentes para abordar essa questão. Uma razão mencionada é o potencial para oferecer incentivos, reconhecimento e até compensação a indivíduos que contribuem com dados valiosos para futuros modelos de IA.
O pano de fundo desta pesquisa são as batalhas legais em curso envolvendo empresas de IA, incluindo a Microsoft, sobre direitos de propriedade intelectual. Modelos de IA são frequentemente treinados em vastos conjuntos de dados extraídos de sites públicos, que podem incluir material protegido por direitos autorais. Embora as empresas de IA frequentemente reivindiquem proteção sob a doutrina do uso justo, criadores de diversos campos — artistas, programadores, autores — contestam essa posição.
A Microsoft está atualmente enfrentando desafios legais, incluindo um processo do The New York Times, que alega que a Microsoft e a OpenAI violaram seus direitos autorais ao usar seus artigos para treinar seus modelos. Além disso, vários desenvolvedores de software processaram a Microsoft por causa de seu assistente de codificação GitHub Copilot AI, alegando que ele foi treinado com seu código protegido por direitos autorais.
O projeto de pesquisa, referido como "proveniência em tempo de treinamento," envolve Jaron Lanier, um notável tecnólogo da Microsoft Research. Lanier já escreveu sobre "dignidade de dados," defendendo um sistema que conecte conteúdo digital aos seus criadores e potencialmente os compense por suas contribuições aos resultados de IA.
Embora o projeto da Microsoft ainda esteja em seus estágios iniciais, outras empresas como Bria, Adobe e Shutterstock já estão experimentando compensar proprietários de dados com base em suas contribuições para modelos de IA. No entanto, grandes laboratórios de IA geralmente não estabeleceram programas de pagamento para contribuidores individuais, optando por acordos de licenciamento ou mecanismos de exclusão para detentores de direitos autorais, que podem ser complicados e limitados em alcance.
A iniciativa da Microsoft pode permanecer como uma prova de conceito, semelhante à ferramenta ainda não lançada da OpenAI para criadores controlarem como suas obras são usadas em dados de treinamento. Há também especulações de que a Microsoft pode estar tentando "lavar" eticamente suas práticas de IA ou antecipar desafios regulatórios e legais.
Essa movimentação da Microsoft é particularmente notável dado os recentes apelos de outros laboratórios de IA, como Google e OpenAI, para que o governo dos EUA relaxe as proteções de direitos autorais para o desenvolvimento de IA. A Microsoft ainda não respondeu a pedidos de comentários sobre este projeto.



This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔




This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔




This is wild! Microsoft’s diving into how specific data shapes AI outputs. Makes me wonder if they’ll start paying people for their data contributions 🤔. Could be a game-changer for fairness in AI!




This is pretty cool! Microsoft’s dive into crediting AI data contributors could really shake up how we think about AI ethics. Imagine if every meme or tweet that trains a model gets a shoutout! 😄 Curious to see where this goes.




माइक्रोसॉफ्ट का AI डेटा कंट्रीब्यूटर्स पर नया प्रोजेक्ट दिलचस्प लगता है, लेकिन मुझे नहीं पता कि यह हम उपयोगकर्ताओं को वास्तव में कैसे लाभ पहुंचाएगा। यह अच्छा है कि वे इस पर शोध कर रहे हैं, लेकिन मुझे उम्मीद है कि यह सिर्फ एक और रिसर्च प्रोजेक्ट नहीं होगा जो खत्म हो जाए। 🤔




O novo projeto da Microsoft sobre contribuintes de dados de IA parece interessante, mas não tenho certeza de como isso realmente nos beneficiará. É legal que eles estejam investigando, mas espero que não seja apenas mais um projeto de pesquisa que não vai pra frente. 🤔












