Microsoft untersucht den Kredit der KI -Datenversuche mit den Mitwirkenden

Microsoft startet ein neues Forschungsprojekt, um zu verstehen, wie spezifische Trainingsbeispiele die Ausgaben generativer KI-Modelle wie Texte, Bilder und andere Medien beeinflussen. Dieses Vorhaben wurde in einer Stellenanzeige vom Dezember hervorgehoben, die kürzlich auf LinkedIn wieder auftauchte und einen Forschungspraktikanten für das Projekt sucht.
Ziel des Projekts ist es, eine Methode zu entwickeln, um den Einfluss bestimmter Daten, wie Fotos und Bücher, auf die Modellausgaben „effizient und nützlich abzuschätzen“. Die Stellenanzeige weist darauf hin, dass aktuelle neuronale Netzwerkarchitekturen keine Transparenz bei der Nachverfolgung der Herkunft ihrer Ausgaben bieten, und es gibt überzeugende Gründe, dieses Problem anzugehen. Ein genannter Grund ist das Potenzial, Anreize, Anerkennung oder sogar Vergütungen für Personen zu bieten, die wertvolle Daten für zukünftige KI-Modelle beisteuern.
Hintergrund dieser Forschung sind die laufenden rechtlichen Auseinandersetzungen von KI-Unternehmen, einschließlich Microsoft, über Rechte am geistigen Eigentum. KI-Modelle werden oft mit großen, aus öffentlichen Websites gesammelten Datensätzen trainiert, die urheberrechtlich geschütztes Material enthalten können. Während KI-Unternehmen oft Schutz unter der Fair-Use-Doktrin beanspruchen, bestreiten Kreative aus verschiedenen Bereichen – Künstler, Programmierer, Autoren – diese Haltung.
Microsoft sieht sich derzeit rechtlichen Herausforderungen gegenüber, einschließlich einer Klage von The New York Times, die behauptet, dass Microsoft und OpenAI durch die Nutzung ihrer Artikel zum Trainieren ihrer Modelle Urheberrechte verletzt haben. Zudem haben mehrere Softwareentwickler Microsoft wegen seines GitHub Copilot KI-Coding-Assistenten verklagt, mit der Behauptung, er sei mit ihrem urheberrechtlich geschützten Code trainiert worden.
Das Forschungsprojekt, bezeichnet als „Training-Time Provenance“, involviert Jaron Lanier, einen bekannten Technologen bei Microsoft Research. Lanier hat zuvor über „Data Dignity“ geschrieben und plädiert für ein System, das digitale Inhalte mit ihren Schöpfern verknüpft und sie potenziell für ihre Beiträge zu KI-Ausgaben entschädigt.
Während Microsofts Projekt noch in den Anfängen steckt, experimentieren andere Unternehmen wie Bria, Adobe und Shutterstock bereits mit der Vergütung von Dateninhabern basierend auf ihren Beiträgen zu KI-Modellen. Große KI-Labore haben jedoch im Allgemeinen keine Auszahlungsprogramme für einzelne Beitragszahler etabliert, sondern setzen auf Lizenzvereinbarungen oder Opt-Out-Mechanismen für Urheberrechtsinhaber, die umständlich und begrenzt sein können.
Microsofts Initiative könnte ein Proof of Concept bleiben, ähnlich wie OpenAIs noch nicht veröffentlichtes Tool, das Kreativen Kontrolle darüber gibt, wie ihre Werke in Trainingsdaten verwendet werden. Es gibt auch Spekulationen, dass Microsoft versuchen könnte, seine KI-Praktiken „ethisch zu reinigen“ oder regulatorischen und rechtlichen Herausforderungen zuvorzukommen.
Dieser Schritt von Microsoft ist besonders bemerkenswert angesichts der jüngsten Forderungen anderer KI-Labore wie Google und OpenAI, dass die US-Regierung die Urheberrechtsschutzbestimmungen für die KI-Entwicklung lockern solle. Microsoft hat auf Anfragen zu diesem Projekt noch nicht geantwortet.
Verwandter Artikel
Snowflake investiert über 600 Millionen Dollar in maßgeschneiderte AWS-Chips für den Ausbau der KI im Unternehmensbereich
Snowflake, der Cloud-Datenriese, hat Pläne bekannt gegeben, in den nächsten sechs Jahren über 600 Millionen US-Dollar in den Erwerb von CPUs und KI-Beschleunigern der Graviton-Serie zu investieren, di
China Telecom investiert in Mianbi Intelligence und erhöht das Kapital für LLM und Dateninfrastruktur auf 713.000 Yuan
Das „Nationalteam“ und die führende Persönlichkeit der Tsinghua-Universität im Bereich der großen Modelle vertiefen ihre strategische Zusammenarbeit. Am 1. März 2026 unterzog sich die Beijing Mianbi I
Die Taotian Group treibt ihre KI-orientierte Umstrukturierung voran und gewährt Praktikanten kostenlose Token-Kontingente
Die TaoTian Group hat kürzlich den „AI Productivity Plan“ eingeführt, der darauf abzielt, die Integration von KI-Technologie in E-Commerce-Abläufe und F&E-Workflows durch die Zuweisung von Ressourcen
Empfehlungen zu verwandten Spezialthemen
Kommentare (37)
Interesante proyecto, pero lo que realmente necesito es que alguien en la IA me explique por qué mi asistente virtual aún no puede organizarme el escritorio 😅. ¿Esto de la atribución podría cambiar cómo las empresas comparten datos? Me preocupa un poco la transparencia de todo el proceso. Ojalá no sea solo un gesto de relaciones públicas.
Lo de Microsoft parece interesante pero, ¿y la privacidad de los datos? 🤔 A veces siento que con toda esta exploración de IA, estamos perdiendo el control de lo que se usa para entrenar los modelos. ¿Habrá una compensación justa para quienes contribuyeron? No quiero que esto se convierta en otro caso de 'big tech' aprovechándose de 'datos gratis'...
이런 연구는 AI 데이터 기여자들에게 공정한 보상을 제공하는 데 중요한 단계가 될 수 있겠네요. 😊 근데 MS가 과연 저작권 문제를 해결할 수 있을지 의문이 드네요. 데이터 소싱 방식이 좀 더 투명해져야 할 시점인 것 같아요!
This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔
This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔

Microsoft startet ein neues Forschungsprojekt, um zu verstehen, wie spezifische Trainingsbeispiele die Ausgaben generativer KI-Modelle wie Texte, Bilder und andere Medien beeinflussen. Dieses Vorhaben wurde in einer Stellenanzeige vom Dezember hervorgehoben, die kürzlich auf LinkedIn wieder auftauchte und einen Forschungspraktikanten für das Projekt sucht.
Ziel des Projekts ist es, eine Methode zu entwickeln, um den Einfluss bestimmter Daten, wie Fotos und Bücher, auf die Modellausgaben „effizient und nützlich abzuschätzen“. Die Stellenanzeige weist darauf hin, dass aktuelle neuronale Netzwerkarchitekturen keine Transparenz bei der Nachverfolgung der Herkunft ihrer Ausgaben bieten, und es gibt überzeugende Gründe, dieses Problem anzugehen. Ein genannter Grund ist das Potenzial, Anreize, Anerkennung oder sogar Vergütungen für Personen zu bieten, die wertvolle Daten für zukünftige KI-Modelle beisteuern.
Hintergrund dieser Forschung sind die laufenden rechtlichen Auseinandersetzungen von KI-Unternehmen, einschließlich Microsoft, über Rechte am geistigen Eigentum. KI-Modelle werden oft mit großen, aus öffentlichen Websites gesammelten Datensätzen trainiert, die urheberrechtlich geschütztes Material enthalten können. Während KI-Unternehmen oft Schutz unter der Fair-Use-Doktrin beanspruchen, bestreiten Kreative aus verschiedenen Bereichen – Künstler, Programmierer, Autoren – diese Haltung.
Microsoft sieht sich derzeit rechtlichen Herausforderungen gegenüber, einschließlich einer Klage von The New York Times, die behauptet, dass Microsoft und OpenAI durch die Nutzung ihrer Artikel zum Trainieren ihrer Modelle Urheberrechte verletzt haben. Zudem haben mehrere Softwareentwickler Microsoft wegen seines GitHub Copilot KI-Coding-Assistenten verklagt, mit der Behauptung, er sei mit ihrem urheberrechtlich geschützten Code trainiert worden.
Das Forschungsprojekt, bezeichnet als „Training-Time Provenance“, involviert Jaron Lanier, einen bekannten Technologen bei Microsoft Research. Lanier hat zuvor über „Data Dignity“ geschrieben und plädiert für ein System, das digitale Inhalte mit ihren Schöpfern verknüpft und sie potenziell für ihre Beiträge zu KI-Ausgaben entschädigt.
Während Microsofts Projekt noch in den Anfängen steckt, experimentieren andere Unternehmen wie Bria, Adobe und Shutterstock bereits mit der Vergütung von Dateninhabern basierend auf ihren Beiträgen zu KI-Modellen. Große KI-Labore haben jedoch im Allgemeinen keine Auszahlungsprogramme für einzelne Beitragszahler etabliert, sondern setzen auf Lizenzvereinbarungen oder Opt-Out-Mechanismen für Urheberrechtsinhaber, die umständlich und begrenzt sein können.
Microsofts Initiative könnte ein Proof of Concept bleiben, ähnlich wie OpenAIs noch nicht veröffentlichtes Tool, das Kreativen Kontrolle darüber gibt, wie ihre Werke in Trainingsdaten verwendet werden. Es gibt auch Spekulationen, dass Microsoft versuchen könnte, seine KI-Praktiken „ethisch zu reinigen“ oder regulatorischen und rechtlichen Herausforderungen zuvorzukommen.
Dieser Schritt von Microsoft ist besonders bemerkenswert angesichts der jüngsten Forderungen anderer KI-Labore wie Google und OpenAI, dass die US-Regierung die Urheberrechtsschutzbestimmungen für die KI-Entwicklung lockern solle. Microsoft hat auf Anfragen zu diesem Projekt noch nicht geantwortet.
Snowflake investiert über 600 Millionen Dollar in maßgeschneiderte AWS-Chips für den Ausbau der KI im Unternehmensbereich
Snowflake, der Cloud-Datenriese, hat Pläne bekannt gegeben, in den nächsten sechs Jahren über 600 Millionen US-Dollar in den Erwerb von CPUs und KI-Beschleunigern der Graviton-Serie zu investieren, di
China Telecom investiert in Mianbi Intelligence und erhöht das Kapital für LLM und Dateninfrastruktur auf 713.000 Yuan
Das „Nationalteam“ und die führende Persönlichkeit der Tsinghua-Universität im Bereich der großen Modelle vertiefen ihre strategische Zusammenarbeit. Am 1. März 2026 unterzog sich die Beijing Mianbi I
Die Taotian Group treibt ihre KI-orientierte Umstrukturierung voran und gewährt Praktikanten kostenlose Token-Kontingente
Die TaoTian Group hat kürzlich den „AI Productivity Plan“ eingeführt, der darauf abzielt, die Integration von KI-Technologie in E-Commerce-Abläufe und F&E-Workflows durch die Zuweisung von Ressourcen
Interesante proyecto, pero lo que realmente necesito es que alguien en la IA me explique por qué mi asistente virtual aún no puede organizarme el escritorio 😅. ¿Esto de la atribución podría cambiar cómo las empresas comparten datos? Me preocupa un poco la transparencia de todo el proceso. Ojalá no sea solo un gesto de relaciones públicas.
Lo de Microsoft parece interesante pero, ¿y la privacidad de los datos? 🤔 A veces siento que con toda esta exploración de IA, estamos perdiendo el control de lo que se usa para entrenar los modelos. ¿Habrá una compensación justa para quienes contribuyeron? No quiero que esto se convierta en otro caso de 'big tech' aprovechándose de 'datos gratis'...
이런 연구는 AI 데이터 기여자들에게 공정한 보상을 제공하는 데 중요한 단계가 될 수 있겠네요. 😊 근데 MS가 과연 저작권 문제를 해결할 수 있을지 의문이 드네요. 데이터 소싱 방식이 좀 더 투명해져야 할 시점인 것 같아요!
This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔
This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔





Heim






