Microsoft explora que os contribuintes de dados da IA

Lar

Notícias

10 de Abril de 2025

NicholasLewis

191

Microsoft explora que os contribuintes de dados da IA

A Microsoft está iniciando um novo projeto de pesquisa com o objetivo de entender como exemplos de treinamento específicos influenciam os resultados de modelos de IA generativa, como textos, imagens e outros meios. Esta iniciativa foi destacada em uma vaga de emprego de dezembro que recentemente ressurgiu no LinkedIn, buscando um estagiário de pesquisa para se juntar ao esforço.

O objetivo do projeto é desenvolver um método para treinar modelos de modo que o impacto de dados específicos, como fotos e livros, em seus resultados possa ser "eficientemente e utilmente estimado." A vaga aponta que as atuais arquiteturas de redes neurais carecem de transparência ao rastrear as origens de seus resultados, e há razões convincentes para abordar essa questão. Uma razão mencionada é o potencial para oferecer incentivos, reconhecimento e até compensação a indivíduos que contribuem com dados valiosos para futuros modelos de IA.

O pano de fundo desta pesquisa são as batalhas legais em curso envolvendo empresas de IA, incluindo a Microsoft, sobre direitos de propriedade intelectual. Modelos de IA são frequentemente treinados em vastos conjuntos de dados extraídos de sites públicos, que podem incluir material protegido por direitos autorais. Embora as empresas de IA frequentemente reivindiquem proteção sob a doutrina do uso justo, criadores de diversos campos — artistas, programadores, autores — contestam essa posição.

A Microsoft está atualmente enfrentando desafios legais, incluindo um processo do The New York Times, que alega que a Microsoft e a OpenAI violaram seus direitos autorais ao usar seus artigos para treinar seus modelos. Além disso, vários desenvolvedores de software processaram a Microsoft por causa de seu assistente de codificação GitHub Copilot AI, alegando que ele foi treinado com seu código protegido por direitos autorais.

O projeto de pesquisa, referido como "proveniência em tempo de treinamento," envolve Jaron Lanier, um notável tecnólogo da Microsoft Research. Lanier já escreveu sobre "dignidade de dados," defendendo um sistema que conecte conteúdo digital aos seus criadores e potencialmente os compense por suas contribuições aos resultados de IA.

Embora o projeto da Microsoft ainda esteja em seus estágios iniciais, outras empresas como Bria, Adobe e Shutterstock já estão experimentando compensar proprietários de dados com base em suas contribuições para modelos de IA. No entanto, grandes laboratórios de IA geralmente não estabeleceram programas de pagamento para contribuidores individuais, optando por acordos de licenciamento ou mecanismos de exclusão para detentores de direitos autorais, que podem ser complicados e limitados em alcance.

A iniciativa da Microsoft pode permanecer como uma prova de conceito, semelhante à ferramenta ainda não lançada da OpenAI para criadores controlarem como suas obras são usadas em dados de treinamento. Há também especulações de que a Microsoft pode estar tentando "lavar" eticamente suas práticas de IA ou antecipar desafios regulatórios e legais.

Essa movimentação da Microsoft é particularmente notável dado os recentes apelos de outros laboratórios de IA, como Google e OpenAI, para que o governo dos EUA relaxe as proteções de direitos autorais para o desenvolvimento de IA. A Microsoft ainda não respondeu a pedidos de comentários sobre este projeto.

Artigo relacionado

Cartas de apresentação com tecnologia de IA: Guia especializado para submissão de artigos em periódicos No competitivo ambiente de publicação acadêmica de hoje, a elaboração de uma carta de apresentação eficaz pode fazer a diferença crucial na aceitação do seu manuscrito. Descubra como as ferramentas co

EUA sancionarão autoridades estrangeiras por causa de regulamentações de mídia social EUA se posicionam contra as regulamentações globais de conteúdo digitalO Departamento de Estado emitiu uma forte repreensão diplomática nesta semana, visando às políticas europeias de governança dig

Guia definitivo para resumidores de vídeos do YouTube com tecnologia de IA Em nosso cenário digital rico em informações, os resumidores de vídeo do YouTube com tecnologia de IA se tornaram indispensáveis para o consumo eficiente de conteúdo. Este guia detalhado explora como

Comentários (34)

0/200

Enviar

JuanWhite

15 de Agosto de 2025 à0 20:01:00 WEST

This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔

BrianWilliams

11 de Agosto de 2025 à59 06:00:59 WEST

This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔

ChristopherThomas

6 de Agosto de 2025 à59 22:00:59 WEST

This is wild! Microsoft’s diving into how specific data shapes AI outputs. Makes me wonder if they’ll start paying people for their data contributions 🤔. Could be a game-changer for fairness in AI!

DavidThomas

31 de Julho de 2025 à39 12:35:39 WEST

This is pretty cool! Microsoft’s dive into crediting AI data contributors could really shake up how we think about AI ethics. Imagine if every meme or tweet that trains a model gets a shoutout! 😄 Curious to see where this goes.

DonaldEvans

21 de Abril de 2025 à51 00:02:51 WEST

माइक्रोसॉफ्ट का AI डेटा कंट्रीब्यूटर्स पर नया प्रोजेक्ट दिलचस्प लगता है, लेकिन मुझे नहीं पता कि यह हम उपयोगकर्ताओं को वास्तव में कैसे लाभ पहुंचाएगा। यह अच्छा है कि वे इस पर शोध कर रहे हैं, लेकिन मुझे उम्मीद है कि यह सिर्फ एक और रिसर्च प्रोजेक्ट नहीं होगा जो खत्म हो जाए। 🤔

SamuelRoberts

20 de Abril de 2025 à47 20:48:47 WEST

O novo projeto da Microsoft sobre contribuintes de dados de IA parece interessante, mas não tenho certeza de como isso realmente nos beneficiará. É legal que eles estejam investigando, mas espero que não seja apenas mais um projeto de pesquisa que não vai pra frente. 🤔

Principais notícias

Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas Gemini 2.5 Pro agora ilimitado e mais barato que Claude, GPT-4o Dublagem AI: Guia Definitivo para Criação de Voz Realista A IA de Cambium transforma a madeira desperdiçada em madeira serrada AI Builder e Power Automate Revolucionam a Sumarização de Documentos O OpenAI aprimora o assistente de voz da IA para bate -papos melhores Como garantir que seus dados sejam confiáveis para a integração de IA Notebooklm se expande globalmente, adiciona slides e verificação de fatos aprimorada Tweaks to Us Data Centers podem desbloquear 76 GW de nova capacidade de energia O Google utiliza a IA para suspender mais de 39 milhões de contas de anúncios por suspeita de fraude

Mais

Apresentou