OpenAIs KI, die auf Paywalled O'Reilly -Büchern ausgebildet ist, behaupten Forscher

OpenAI hat zahlreiche Anschuldigungen vorgenommen Eine aktuelle Studie des AI Offenlegungsprojekts, eine gemeinnützige Organisation, die 2024 vom Medienmogul Tim O'Reilly und Ilan Strauss gegründet wurde, legt nahe, dass Openai möglicherweise nicht öffentliche Bücher von O'Reilly Media verwendet hat, um sein fortgeschritteneres Modell GPT-4O auszubilden. KI -Modelle, im Wesentlichen anspruchsvolle Vorhersage -Motoren, werden in riesigen Datensätzen wie Büchern, Filmen und Fernsehsendungen geschult. Sie lernen Muster und erzeugen Reaktionen, die auf diesen Mustern basieren, ohne etwas Neues zu schaffen, sondern sich von ihrer umfangreichen Wissensbasis nähern. Da reale Datenquellen wie das öffentliche Web erschöpft werden, haben einige KI-Labors, einschließlich OpenAI, mit A-generierte Daten für das Training begonnen, obwohl nur wenige aufgrund der Risiken der Abbaumodellleistung die Daten der realen Welt vollständig aufgegeben haben. Das Papier des AI Offenlegungsprojekts behauptet, dass das GPT-4O-Modell von OpenAI, das in Chatgpt standardmäßig ist, eine starke Anerkennung von Inhalten aus Paywalled O'Reilly-Büchern zeigt, im Gegensatz zum früheren GPT-3,5-Turbo-Modell. Das Papier deutet darauf hin, dass GPT-4O wahrscheinlich in diesen nicht öffentlichen Büchern geschult wurde, obwohl O'Reilly Media keine Lizenzvereinbarung mit OpenAI hatte. Die Studie verwendete eine Methode namens DE-COP, die 2024 eingeführt wurde, um urheberrechtlich geschützte Inhalte in KI-Schulungsdaten zu erkennen. In diesem "Mitgliedschaftsschließanfall" testet ein Modell, ob ein Modell zwischen menschlich verfassten Texten und AI-generierten Paraphrasen unterscheiden kann, was auf Vorkenntnisse des Textes hinweist, wenn dies zuverlässig dies kann. Die Forscher testeten GPT-4O, GPT-3,5-Turbo und andere OpenAI-Modelle mit 13.962 Absatzauszügen aus 34 O'Reilly-Büchern und stellten fest, dass GPT-4O deutlich mehr Pay-aus-Inhalt erkannte als die älteren Modelle. Während die Autoren anerkennen, dass ihre Methode nicht narrensicher ist und dass der Paywalled -Inhalt möglicherweise von Benutzern eingeführt wurde, die in ChatGPT kopieren und einfügen, werfen die Ergebnisse Fragen zu den Datenpraktiken von OpenAI auf. In der Studie wurden OpenAIs neueste Modelle wie GPT-4,5 und Argumentationsmodelle wie O3-Mini und O1 nicht bewertet, wodurch die Möglichkeit offen wurde, dass diese möglicherweise nicht an denselben Daten geschult wurden. OpenAI hat nach entspannteren Urheberrechtsgesetzen in Bezug auf KI-Schulungsdaten gedrängt und nach Datenquellen von höherer Qualität gesucht. Das Unternehmen hat sogar Journalisten beauftragt, die Ergebnisse seiner Modelle zu verfeinern, eine Praxis in der KI -Branche, in der Experten in verschiedenen Bereichen zur Verbesserung der KI -Systeme eingestellt werden. OpenAI zahlt einige seiner Schulungsdaten, hat Lizenzvereinbarungen mit verschiedenen Inhaltsanbietern und bietet Opt-out-Mechanismen für Urheberrechtseigentümer an. Da das Unternehmen jedoch rechtliche Herausforderungen gegenüber seinen Datenpraktiken hat, haben die Ergebnisse des O'Reilly -Papiers einen Schatten über seine Operationen geworfen. OpenAI antwortete nicht auf Anfragen nach Kommentaren zur Studie.
Verwandter Artikel
OpenAI übernimmt das AI-Start-up für persönliche Finanzen Hiro
OpenAI hat das Finanzstart-up Hiro Finance übernommen, wie Gründer Ethan Bloch am Montag bekannt gab. OpenAI bestätigte die Übernahme gegenüber TechCrunch. Das Start-up erhielt Unterstützung von der führenden Fintech-Venture-Capital-Firma Ribbit sowi
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Empfehlungen zu verwandten Spezialthemen
Kommentare (42)
This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅

OpenAI übernimmt das AI-Start-up für persönliche Finanzen Hiro
OpenAI hat das Finanzstart-up Hiro Finance übernommen, wie Gründer Ethan Bloch am Montag bekannt gab. OpenAI bestätigte die Übernahme gegenüber TechCrunch. Das Start-up erhielt Unterstützung von der führenden Fintech-Venture-Capital-Firma Ribbit sowi
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅





Heim






