Microsoft explora que os contribuintes de dados da IA
10 de Abril de 2025
NicholasLewis
93

A Microsoft está embarcando em um novo projeto de pesquisa destinado a entender como exemplos de treinamento específicos influenciam os resultados dos modelos generativos de IA, como texto, imagens e outras mídias. Essa iniciativa foi destacada em uma listagem de empregos de dezembro que ressurgiu recentemente no LinkedIn, buscando um estagiário de pesquisa para participar do esforço. O objetivo do projeto é desenvolver um método para treinar modelos para que o impacto de dados específicos, como fotos e livros, em seus resultados, possa ser "estimado de maneira eficiente e útil". A listagem de empregos aponta que as arquiteturas atuais de rede neural não têm transparência no rastreamento das origens de seus resultados, e há razões convincentes para resolver esse problema. Um motivo mencionado é o potencial de fornecer incentivos, reconhecimento e até compensação a indivíduos que contribuem com dados valiosos para futuros modelos de IA. O pano de fundo desta pesquisa é as batalhas legais em andamento envolvendo empresas de IA, incluindo a Microsoft, sobre os direitos de propriedade intelectual. Os modelos de IA são frequentemente treinados em vastos conjuntos de dados raspados em sites públicos, que podem incluir material protegido por direitos autorais. Enquanto as empresas de IA geralmente reivindicam proteção sob doutrina de uso justo, os criadores de vários campos - artistas, programadores, autores - disputam essa posição. A Atualmente, a Microsoft está enfrentando desafios legais, incluindo uma ação judicial do New York Times, que alega que a Microsoft e o Openai violaram seus direitos autorais usando seus artigos para treinar seus modelos. Além disso, vários desenvolvedores de software processaram a Microsoft por causa do assistente de codificação da copilota do GitHub, alegando que foi treinado em seu código protegido por direitos autorais. O projeto de pesquisa, conhecido como "proveniência em tempo de treinamento", envolve Jaron Lanier, um tecnólogo notável da Microsoft Research. Lanier já havia escrito sobre "Dignidade de dados", defendendo um sistema que conecta conteúdo digital com seus criadores e potencialmente os compensa por suas contribuições para as saídas da IA. Embora o projeto da Microsoft ainda esteja em seus estágios iniciais, outras empresas como Bria, Adobe e Shutterstock já estão experimentando compensar os proprietários de dados com base em suas contribuições para os modelos de IA. No entanto, os grandes laboratórios de IA geralmente não estabeleceram programas individuais de pagamento de colaboradores, optando por acordos de licenciamento ou mecanismos de exclusão para detentores de direitos autorais, que podem ser complicados e limitados. A iniciativa da Microsoft pode permanecer uma prova de conceito, semelhante à ferramenta ainda a ser lançada para os criadores do OpenAI para controlar como seus trabalhos são usados nos dados de treinamento. Também há especulações de que a Microsoft possa estar tentando "lavar a ética" suas práticas de IA ou preferir desafios regulatórios e legais. Esse movimento da Microsoft é particularmente digno de nota, dadas as recentes ligações de outros laboratórios de IA, como Google e Openai, para o governo dos EUA relaxar as proteções de direitos autorais para o desenvolvimento da IA. A Microsoft ainda não respondeu aos pedidos de comentários sobre este projeto.
Artigo relacionado
Geração de fotos da IA no WhatsApp: Guia completo para 2025
Em 2025, o mundo da criação visual se transformou, graças à integração perfeita da inteligência artificial em aplicativos cotidianos como o WhatsApp. Com a Meta AI agora parte da plataforma, todos podem mergulhar no reino das fotos geradas pela IA desde o seu aplicativo de mensagens favorito. Esse
Consistência do personagem de Leonardo ai: uma visão geral aprofundada
Criar personagens consistentes na arte gerada pela IA nunca foi tão fácil, graças às ferramentas inovadoras fornecidas pela Leonardo AI. Este guia investiga o recurso de referência de caracteres, que o capacita a manter a consistência do personagem em várias configurações, ambientes e até mesmo FAC
API da Anthropic Lança Busca Web com IA
A Anthropic acaba de lançar uma nova API que potencializa seus modelos de IA Claude com a capacidade de vasculhar a web em busca das informações mais recentes. Isso significa que o
Comentários (30)
0/200
KeithSmith
10 de Abril de 2025 à43 14:45:43 GMT
Microsoft's project on crediting AI data contributors is super interesting! It's about time someone looked into how our data shapes AI outputs. I'm curious to see how they'll implement this, but it's a bit of a mystery right now. Can't wait for more updates!
0
DanielLewis
10 de Abril de 2025 à43 14:45:43 GMT
マイクロソフトのAIデータ貢献者へのクレジットプロジェクトはとても興味深いです!私たちのデータがAIの出力にどのように影響を与えるかを誰かが調査する時が来ました。どのように実装するのか興味がありますが、今はまだ謎です。もっと更新を待ちきれません!
0
JackPerez
10 de Abril de 2025 à43 14:45:43 GMT
마이크로소프트의 AI 데이터 기여자에게 크레딧을 주는 프로젝트는 정말 흥미로워요! 우리의 데이터가 AI 출력에 어떻게 영향을 미치는지 누군가가 조사할 때가 왔어요. 어떻게 구현할지 궁금하지만, 지금은 아직 미스터리예요. 더 많은 업데이트를 기다릴 수 없어요!
0
AlbertAllen
10 de Abril de 2025 à43 14:45:43 GMT
O projeto da Microsoft sobre dar crédito aos contribuintes de dados de IA é super interessante! Já era hora de alguém investigar como nossos dados moldam as saídas de IA. Estou curioso para ver como eles vão implementar isso, mas é um pouco misterioso agora. Mal posso esperar por mais atualizações!
0
HaroldMiller
10 de Abril de 2025 à43 14:45:43 GMT
El proyecto de Microsoft sobre dar crédito a los contribuyentes de datos de IA es súper interesante. ¡Ya era hora de que alguien investigara cómo nuestros datos moldean las salidas de IA! Estoy curioso por ver cómo lo implementarán, pero es un poco misterioso por ahora. ¡No puedo esperar por más actualizaciones!
0
BruceHernández
11 de Abril de 2025 à25 05:11:25 GMT
Microsoft's new project on understanding AI training data is super interesting! It's cool to see how they're trying to figure out the nitty-gritty of AI outputs. The only downside is it feels a bit too academic for my taste, but I'm excited to see where it goes. Keep up the good work, Microsoft!
0










Microsoft's project on crediting AI data contributors is super interesting! It's about time someone looked into how our data shapes AI outputs. I'm curious to see how they'll implement this, but it's a bit of a mystery right now. Can't wait for more updates!




マイクロソフトのAIデータ貢献者へのクレジットプロジェクトはとても興味深いです!私たちのデータがAIの出力にどのように影響を与えるかを誰かが調査する時が来ました。どのように実装するのか興味がありますが、今はまだ謎です。もっと更新を待ちきれません!




마이크로소프트의 AI 데이터 기여자에게 크레딧을 주는 프로젝트는 정말 흥미로워요! 우리의 데이터가 AI 출력에 어떻게 영향을 미치는지 누군가가 조사할 때가 왔어요. 어떻게 구현할지 궁금하지만, 지금은 아직 미스터리예요. 더 많은 업데이트를 기다릴 수 없어요!




O projeto da Microsoft sobre dar crédito aos contribuintes de dados de IA é super interessante! Já era hora de alguém investigar como nossos dados moldam as saídas de IA. Estou curioso para ver como eles vão implementar isso, mas é um pouco misterioso agora. Mal posso esperar por mais atualizações!




El proyecto de Microsoft sobre dar crédito a los contribuyentes de datos de IA es súper interesante. ¡Ya era hora de que alguien investigara cómo nuestros datos moldean las salidas de IA! Estoy curioso por ver cómo lo implementarán, pero es un poco misterioso por ahora. ¡No puedo esperar por más actualizaciones!




Microsoft's new project on understanding AI training data is super interesting! It's cool to see how they're trying to figure out the nitty-gritty of AI outputs. The only downside is it feels a bit too academic for my taste, but I'm excited to see where it goes. Keep up the good work, Microsoft!












