OpenAIs KI, die auf Paywalled O'Reilly -Büchern ausgebildet ist, behaupten Forscher

Heim

Nachricht

7. April 2025

JuanThomas

217

# openai

OpenAIs KI, die auf Paywalled O'Reilly -Büchern ausgebildet ist, behaupten Forscher

OpenAI hat zahlreiche Anschuldigungen vorgenommen Eine aktuelle Studie des AI Offenlegungsprojekts, eine gemeinnützige Organisation, die 2024 vom Medienmogul Tim O'Reilly und Ilan Strauss gegründet wurde, legt nahe, dass Openai möglicherweise nicht öffentliche Bücher von O'Reilly Media verwendet hat, um sein fortgeschritteneres Modell GPT-4O auszubilden. KI -Modelle, im Wesentlichen anspruchsvolle Vorhersage -Motoren, werden in riesigen Datensätzen wie Büchern, Filmen und Fernsehsendungen geschult. Sie lernen Muster und erzeugen Reaktionen, die auf diesen Mustern basieren, ohne etwas Neues zu schaffen, sondern sich von ihrer umfangreichen Wissensbasis nähern. Da reale Datenquellen wie das öffentliche Web erschöpft werden, haben einige KI-Labors, einschließlich OpenAI, mit A-generierte Daten für das Training begonnen, obwohl nur wenige aufgrund der Risiken der Abbaumodellleistung die Daten der realen Welt vollständig aufgegeben haben. Das Papier des AI Offenlegungsprojekts behauptet, dass das GPT-4O-Modell von OpenAI, das in Chatgpt standardmäßig ist, eine starke Anerkennung von Inhalten aus Paywalled O'Reilly-Büchern zeigt, im Gegensatz zum früheren GPT-3,5-Turbo-Modell. Das Papier deutet darauf hin, dass GPT-4O wahrscheinlich in diesen nicht öffentlichen Büchern geschult wurde, obwohl O'Reilly Media keine Lizenzvereinbarung mit OpenAI hatte. Die Studie verwendete eine Methode namens DE-COP, die 2024 eingeführt wurde, um urheberrechtlich geschützte Inhalte in KI-Schulungsdaten zu erkennen. In diesem "Mitgliedschaftsschließanfall" testet ein Modell, ob ein Modell zwischen menschlich verfassten Texten und AI-generierten Paraphrasen unterscheiden kann, was auf Vorkenntnisse des Textes hinweist, wenn dies zuverlässig dies kann. Die Forscher testeten GPT-4O, GPT-3,5-Turbo und andere OpenAI-Modelle mit 13.962 Absatzauszügen aus 34 O'Reilly-Büchern und stellten fest, dass GPT-4O deutlich mehr Pay-aus-Inhalt erkannte als die älteren Modelle. Während die Autoren anerkennen, dass ihre Methode nicht narrensicher ist und dass der Paywalled -Inhalt möglicherweise von Benutzern eingeführt wurde, die in ChatGPT kopieren und einfügen, werfen die Ergebnisse Fragen zu den Datenpraktiken von OpenAI auf. In der Studie wurden OpenAIs neueste Modelle wie GPT-4,5 und Argumentationsmodelle wie O3-Mini und O1 nicht bewertet, wodurch die Möglichkeit offen wurde, dass diese möglicherweise nicht an denselben Daten geschult wurden. OpenAI hat nach entspannteren Urheberrechtsgesetzen in Bezug auf KI-Schulungsdaten gedrängt und nach Datenquellen von höherer Qualität gesucht. Das Unternehmen hat sogar Journalisten beauftragt, die Ergebnisse seiner Modelle zu verfeinern, eine Praxis in der KI -Branche, in der Experten in verschiedenen Bereichen zur Verbesserung der KI -Systeme eingestellt werden. OpenAI zahlt einige seiner Schulungsdaten, hat Lizenzvereinbarungen mit verschiedenen Inhaltsanbietern und bietet Opt-out-Mechanismen für Urheberrechtseigentümer an. Da das Unternehmen jedoch rechtliche Herausforderungen gegenüber seinen Datenpraktiken hat, haben die Ergebnisse des O'Reilly -Papiers einen Schatten über seine Operationen geworfen. OpenAI antwortete nicht auf Anfragen nach Kommentaren zur Studie.

Verwandter Artikel

OpenAI übernimmt das AI-Start-up für persönliche Finanzen Hiro OpenAI hat das Finanzstart-up Hiro Finance übernommen, wie Gründer Ethan Bloch am Montag bekannt gab. OpenAI bestätigte die Übernahme gegenüber TechCrunch. Das Start-up erhielt Unterstützung von der führenden Fintech-Venture-Capital-Firma Ribbit sowi

Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen

OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir

Empfehlungen zu verwandten Spezialthemen

Videoerstellung

Die besten KI-Videotools für Podcaster: Verwandeln Sie Audioaufnahmen in fesselnde Talking-Head-Videos

Entdecken Sie bei XIX.AI die besten KI-Videotools für Podcaster im Jahr 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools, mit denen Sie Ihre Audioaufnahmen mühelos in ansprechende Talking-Head-Videos umwandeln können. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Schaffen Sie sich jetzt einen Vorsprung beim visuellen Storytelling.

10 Tools

xix.ai

Chatbot

Erstelle deine eigene KI-Liebesgeschichte mit diesen Rollenspiel-Tools

Entdecken Sie die besten KI-Tools für Rollenspiele des Jahres 2026, mit denen Sie fesselnde Geschichten erschaffen können. Die von XIX.AI zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Assistenten, die kreatives Storytelling und emotionale Tiefe ermöglichen. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Beginnen Sie noch heute Ihre ganz persönliche Reise.

10 Tools

xix.ai

Text-zu-Sprache

Die besten KI-Sprachtools für Indie-Spieleentwickler: Sparen Sie Zeit bei der Sprachausgabe für RPGs und Visual Novels

Entdecken Sie die besten KI-Sprachtools für Spieleentwickler im Jahr 2026! Die von XIX.AI zusammengestellte Liste enthält erstklassige, bahnbrechende Lösungen, mit denen Sie bei der Sprachausgabe für RPGs und Visual Novels Zeit und Geld sparen. Entdecken Sie Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten, Praxistests und wöchentlich aktualisierte Rankings. Finden Sie noch heute Ihr perfektes Sprachtool!

10 Tools

xix.ai

Bildung und Lernen

Die besten AI-basierten Werkzeuge für geplantes Wiederholen: Optimieren Sie Ihr Lernplan für Medizinstudenten und Jurastudenten

Entdecken Sie die besten KI-basierten Wiederholungstools für das Jahr 2026, ausgewählt von XIX.AI. Unsere hochbewerteten, bahnbrechenden Tools helfen Medizinstudenten und Jurastudenten dabei, ihre Lernpläne so zu optimieren, dass das Gelernte optimal im Gedächtnis bleibt. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von tatsächlichen Tests sowie wöchentlich aktualisierten Rankings. Entfalten Sie jetzt Ihren Vorsprung beim Lernen.

10 Tools

xix.ai

Videoerstellung

Die besten KI-Plattformen für die Umwandlung von Text in Video zum Verfassen von Drehbüchern und für visuelles Storytelling

Die besten KI-Plattformen für die Umwandlung von Text in Video im Jahr 2026: Erstklassige Tools für das Verfassen von Drehbüchern und visuelles Storytelling. Entdecken Sie leistungsstarke, bahnbrechende Lösungen, mit denen Sie Ihren Text in fesselnde Videos verwandeln können. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand unserer wöchentlich aktualisierten Ranglisten und Praxistests. Finden Sie die perfekte Plattform, um Ihre Kreativität und Produktivität zu steigern. Entdecken Sie die sorgfältig zusammengestellte Auswahl bei XIX.AI.

10 Tools

xix.ai

Chatbot

KI-Multi-Agent-Orchestratoren: Gestaltung komplexer automatisierter Arbeitsabläufe mithilfe natürlicher Sprache

2026 Neuestes: Entdecken Sie die besten AI-Multi-Agenten-Orchestratoren, um mithilfe natürlicher Sprache komplexe automatisierte Arbeitsabläufe zu gestalten. Unsere sorgfältig ausgewählte Liste enthält hochbewertete, leistungsstarke Plattformen für reibungslose Aufgabenerstellung und intelligente Prozessverwaltung. Vergleichen Sie kostenlose und kostenpflichtige Optionen unter Berücksichtigung praktischer Erfahrungen. Nutzen Sie die wöchentlich aktualisierten Rankings von XIX.AI, um einen Vorsprung durch künstliche Intelligenz zu erlangen.

10 Tools

xix.ai

Kommentare (42)

0/500

Bitte melden Sie sich zuerst an

RichardJackson

16. November 2025 15:30:37 MEZ

こんなことされてしまうと、著作権料を払って制作している出版社側はたまったもんじゃないよね…AIの学習データの透明性、もっと求められるべきだと思う。🤔

PeterNelson

31. Juli 2025 13:35:39 MESZ

This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅

HarperJones

23. April 2025 04:24:27 MESZ

OpenAI가 유료 책을 이용해 AI를 훈련했다니 좀 의심스럽네요. 한편으론 AI 성능이 인상적이지만, 데이터 소스를 더 나은 방법으로 찾아야 할 것 같아요. 🤔

WalterWhite

18. April 2025 21:33:48 MESZ

OpenAIの件については少し悩んでいます。O’Reillyの本を無断で使うのはちょっと気持ち悪いですが、彼らが作っているAIはかなりクールですね。次回は本の使用料を払うべきかも？🤔

BruceClark

18. April 2025 04:02:34 MESZ

OpenAIが有料の書籍を使ってAIを訓練しているのは少し問題があるかもしれません。でも、AIの性能は本当に素晴らしいですね。データのソースをより良い方法で見つける必要があると思います。🤔

DennisGarcia

18. April 2025 03:58:35 MESZ

I'm kinda torn about this OpenAI thing. On one hand, using those O’Reilly books without permission feels a bit off, you know? But on the other hand, the AI they're building is pretty slick! Maybe they should just pay for the books next time? 🤔

Top -Nachrichten

AI Builder und Power Automate Revolutionieren die Dokumentenzusammenfassung KI -Hosts des Notebooklm -Podcasts, das jetzt für Interviews verfügbar ist China stellt nationale Standards für humanoide Roboter und verkörperte Intelligenz vor Ramp-Daten zeigen, dass die Akzeptanz von KI in Unternehmen sinkt Bing Image Creator Tutorial: Anleitung zur KI-Kunstgenerierung Lernen Sie, AI-Musik mit Ihrer Stimme zu erstellen: ein Schritt-für-Schritt-Suno-Tutorial iMyFone MagicMic: Echtzeit-AI-Stimmerveränderer Bewertung und Tutorial Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen Embodied Intelligence stellt ersten Branchenstandard zur Eindämmung unkontrollierten Wachstums vor DeepSeek V4 revolutioniert multimodale KI

Mehr

Vorgestellt