Microsoft untersucht den Kredit der KI -Datenversuche mit den Mitwirkenden

Microsoft startet ein neues Forschungsprojekt, um zu verstehen, wie spezifische Trainingsbeispiele die Ausgaben generativer KI-Modelle wie Texte, Bilder und andere Medien beeinflussen. Dieses Vorhaben wurde in einer Stellenanzeige vom Dezember hervorgehoben, die kürzlich auf LinkedIn wieder auftauchte und einen Forschungspraktikanten für das Projekt sucht.
Ziel des Projekts ist es, eine Methode zu entwickeln, um den Einfluss bestimmter Daten, wie Fotos und Bücher, auf die Modellausgaben „effizient und nützlich abzuschätzen“. Die Stellenanzeige weist darauf hin, dass aktuelle neuronale Netzwerkarchitekturen keine Transparenz bei der Nachverfolgung der Herkunft ihrer Ausgaben bieten, und es gibt überzeugende Gründe, dieses Problem anzugehen. Ein genannter Grund ist das Potenzial, Anreize, Anerkennung oder sogar Vergütungen für Personen zu bieten, die wertvolle Daten für zukünftige KI-Modelle beisteuern.
Hintergrund dieser Forschung sind die laufenden rechtlichen Auseinandersetzungen von KI-Unternehmen, einschließlich Microsoft, über Rechte am geistigen Eigentum. KI-Modelle werden oft mit großen, aus öffentlichen Websites gesammelten Datensätzen trainiert, die urheberrechtlich geschütztes Material enthalten können. Während KI-Unternehmen oft Schutz unter der Fair-Use-Doktrin beanspruchen, bestreiten Kreative aus verschiedenen Bereichen – Künstler, Programmierer, Autoren – diese Haltung.
Microsoft sieht sich derzeit rechtlichen Herausforderungen gegenüber, einschließlich einer Klage von The New York Times, die behauptet, dass Microsoft und OpenAI durch die Nutzung ihrer Artikel zum Trainieren ihrer Modelle Urheberrechte verletzt haben. Zudem haben mehrere Softwareentwickler Microsoft wegen seines GitHub Copilot KI-Coding-Assistenten verklagt, mit der Behauptung, er sei mit ihrem urheberrechtlich geschützten Code trainiert worden.
Das Forschungsprojekt, bezeichnet als „Training-Time Provenance“, involviert Jaron Lanier, einen bekannten Technologen bei Microsoft Research. Lanier hat zuvor über „Data Dignity“ geschrieben und plädiert für ein System, das digitale Inhalte mit ihren Schöpfern verknüpft und sie potenziell für ihre Beiträge zu KI-Ausgaben entschädigt.
Während Microsofts Projekt noch in den Anfängen steckt, experimentieren andere Unternehmen wie Bria, Adobe und Shutterstock bereits mit der Vergütung von Dateninhabern basierend auf ihren Beiträgen zu KI-Modellen. Große KI-Labore haben jedoch im Allgemeinen keine Auszahlungsprogramme für einzelne Beitragszahler etabliert, sondern setzen auf Lizenzvereinbarungen oder Opt-Out-Mechanismen für Urheberrechtsinhaber, die umständlich und begrenzt sein können.
Microsofts Initiative könnte ein Proof of Concept bleiben, ähnlich wie OpenAIs noch nicht veröffentlichtes Tool, das Kreativen Kontrolle darüber gibt, wie ihre Werke in Trainingsdaten verwendet werden. Es gibt auch Spekulationen, dass Microsoft versuchen könnte, seine KI-Praktiken „ethisch zu reinigen“ oder regulatorischen und rechtlichen Herausforderungen zuvorzukommen.
Dieser Schritt von Microsoft ist besonders bemerkenswert angesichts der jüngsten Forderungen anderer KI-Labore wie Google und OpenAI, dass die US-Regierung die Urheberrechtsschutzbestimmungen für die KI-Entwicklung lockern solle. Microsoft hat auf Anfragen zu diesem Projekt noch nicht geantwortet.
Verwandter Artikel
Meta AI beantwortet nun Nachrichten von Käufern auf dem Facebook Marketplace
Facebook Marketplace führt neue Meta-KI-Funktionen ein, darunter automatische Antworten auf Käuferanfragen, wie das Unternehmen am Donnerstag bekannt gab. Die Plattform nutzt KI außerdem, um die Erste
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Google stellt Gemini Notebooks vor und vereint NotebookLM mit einer persönlichen Wissensdatenbank
Google hat kürzlich die Funktion „Notebooks“ für Gemini eingeführt, die Nutzern helfen soll, komplexe Projekte durch die Erstellung einer personalisierten Wissensdatenbank zu verwalten. Dieses Update
Empfehlungen zu verwandten Spezialthemen
Kommentare (37)
Interesante proyecto, pero lo que realmente necesito es que alguien en la IA me explique por qué mi asistente virtual aún no puede organizarme el escritorio 😅. ¿Esto de la atribución podría cambiar cómo las empresas comparten datos? Me preocupa un poco la transparencia de todo el proceso. Ojalá no sea solo un gesto de relaciones públicas.
Lo de Microsoft parece interesante pero, ¿y la privacidad de los datos? 🤔 A veces siento que con toda esta exploración de IA, estamos perdiendo el control de lo que se usa para entrenar los modelos. ¿Habrá una compensación justa para quienes contribuyeron? No quiero que esto se convierta en otro caso de 'big tech' aprovechándose de 'datos gratis'...
이런 연구는 AI 데이터 기여자들에게 공정한 보상을 제공하는 데 중요한 단계가 될 수 있겠네요. 😊 근데 MS가 과연 저작권 문제를 해결할 수 있을지 의문이 드네요. 데이터 소싱 방식이 좀 더 투명해져야 할 시점인 것 같아요!
This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔
This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔

Microsoft startet ein neues Forschungsprojekt, um zu verstehen, wie spezifische Trainingsbeispiele die Ausgaben generativer KI-Modelle wie Texte, Bilder und andere Medien beeinflussen. Dieses Vorhaben wurde in einer Stellenanzeige vom Dezember hervorgehoben, die kürzlich auf LinkedIn wieder auftauchte und einen Forschungspraktikanten für das Projekt sucht.
Ziel des Projekts ist es, eine Methode zu entwickeln, um den Einfluss bestimmter Daten, wie Fotos und Bücher, auf die Modellausgaben „effizient und nützlich abzuschätzen“. Die Stellenanzeige weist darauf hin, dass aktuelle neuronale Netzwerkarchitekturen keine Transparenz bei der Nachverfolgung der Herkunft ihrer Ausgaben bieten, und es gibt überzeugende Gründe, dieses Problem anzugehen. Ein genannter Grund ist das Potenzial, Anreize, Anerkennung oder sogar Vergütungen für Personen zu bieten, die wertvolle Daten für zukünftige KI-Modelle beisteuern.
Hintergrund dieser Forschung sind die laufenden rechtlichen Auseinandersetzungen von KI-Unternehmen, einschließlich Microsoft, über Rechte am geistigen Eigentum. KI-Modelle werden oft mit großen, aus öffentlichen Websites gesammelten Datensätzen trainiert, die urheberrechtlich geschütztes Material enthalten können. Während KI-Unternehmen oft Schutz unter der Fair-Use-Doktrin beanspruchen, bestreiten Kreative aus verschiedenen Bereichen – Künstler, Programmierer, Autoren – diese Haltung.
Microsoft sieht sich derzeit rechtlichen Herausforderungen gegenüber, einschließlich einer Klage von The New York Times, die behauptet, dass Microsoft und OpenAI durch die Nutzung ihrer Artikel zum Trainieren ihrer Modelle Urheberrechte verletzt haben. Zudem haben mehrere Softwareentwickler Microsoft wegen seines GitHub Copilot KI-Coding-Assistenten verklagt, mit der Behauptung, er sei mit ihrem urheberrechtlich geschützten Code trainiert worden.
Das Forschungsprojekt, bezeichnet als „Training-Time Provenance“, involviert Jaron Lanier, einen bekannten Technologen bei Microsoft Research. Lanier hat zuvor über „Data Dignity“ geschrieben und plädiert für ein System, das digitale Inhalte mit ihren Schöpfern verknüpft und sie potenziell für ihre Beiträge zu KI-Ausgaben entschädigt.
Während Microsofts Projekt noch in den Anfängen steckt, experimentieren andere Unternehmen wie Bria, Adobe und Shutterstock bereits mit der Vergütung von Dateninhabern basierend auf ihren Beiträgen zu KI-Modellen. Große KI-Labore haben jedoch im Allgemeinen keine Auszahlungsprogramme für einzelne Beitragszahler etabliert, sondern setzen auf Lizenzvereinbarungen oder Opt-Out-Mechanismen für Urheberrechtsinhaber, die umständlich und begrenzt sein können.
Microsofts Initiative könnte ein Proof of Concept bleiben, ähnlich wie OpenAIs noch nicht veröffentlichtes Tool, das Kreativen Kontrolle darüber gibt, wie ihre Werke in Trainingsdaten verwendet werden. Es gibt auch Spekulationen, dass Microsoft versuchen könnte, seine KI-Praktiken „ethisch zu reinigen“ oder regulatorischen und rechtlichen Herausforderungen zuvorzukommen.
Dieser Schritt von Microsoft ist besonders bemerkenswert angesichts der jüngsten Forderungen anderer KI-Labore wie Google und OpenAI, dass die US-Regierung die Urheberrechtsschutzbestimmungen für die KI-Entwicklung lockern solle. Microsoft hat auf Anfragen zu diesem Projekt noch nicht geantwortet.
Meta AI beantwortet nun Nachrichten von Käufern auf dem Facebook Marketplace
Facebook Marketplace führt neue Meta-KI-Funktionen ein, darunter automatische Antworten auf Käuferanfragen, wie das Unternehmen am Donnerstag bekannt gab. Die Plattform nutzt KI außerdem, um die Erste
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Google stellt Gemini Notebooks vor und vereint NotebookLM mit einer persönlichen Wissensdatenbank
Google hat kürzlich die Funktion „Notebooks“ für Gemini eingeführt, die Nutzern helfen soll, komplexe Projekte durch die Erstellung einer personalisierten Wissensdatenbank zu verwalten. Dieses Update
Interesante proyecto, pero lo que realmente necesito es que alguien en la IA me explique por qué mi asistente virtual aún no puede organizarme el escritorio 😅. ¿Esto de la atribución podría cambiar cómo las empresas comparten datos? Me preocupa un poco la transparencia de todo el proceso. Ojalá no sea solo un gesto de relaciones públicas.
Lo de Microsoft parece interesante pero, ¿y la privacidad de los datos? 🤔 A veces siento que con toda esta exploración de IA, estamos perdiendo el control de lo que se usa para entrenar los modelos. ¿Habrá una compensación justa para quienes contribuyeron? No quiero que esto se convierta en otro caso de 'big tech' aprovechándose de 'datos gratis'...
이런 연구는 AI 데이터 기여자들에게 공정한 보상을 제공하는 데 중요한 단계가 될 수 있겠네요. 😊 근데 MS가 과연 저작권 문제를 해결할 수 있을지 의문이 드네요. 데이터 소싱 방식이 좀 더 투명해져야 할 시점인 것 같아요!
This is super intriguing! Microsoft's diving into how AI training data shapes outputs—mind-blowing stuff. Wonder how they'll credit contributors fairly? 🤔
This Microsoft AI project sounds intriguing! Crediting data contributors could reshape how we value creative input in AI. Curious to see if it'll spark ethical debates or just be a tech flex. 🤔





Heim






