Option
Heim
Nachricht
OpenAIs KI, die auf Paywalled O'Reilly -Büchern ausgebildet ist, behaupten Forscher

OpenAIs KI, die auf Paywalled O'Reilly -Büchern ausgebildet ist, behaupten Forscher

7. April 2025
217

OpenAIs KI, die auf Paywalled O'Reilly -Büchern ausgebildet ist, behaupten Forscher

OpenAI hat zahlreiche Anschuldigungen vorgenommen Eine aktuelle Studie des AI Offenlegungsprojekts, eine gemeinnützige Organisation, die 2024 vom Medienmogul Tim O'Reilly und Ilan Strauss gegründet wurde, legt nahe, dass Openai möglicherweise nicht öffentliche Bücher von O'Reilly Media verwendet hat, um sein fortgeschritteneres Modell GPT-4O auszubilden. KI -Modelle, im Wesentlichen anspruchsvolle Vorhersage -Motoren, werden in riesigen Datensätzen wie Büchern, Filmen und Fernsehsendungen geschult. Sie lernen Muster und erzeugen Reaktionen, die auf diesen Mustern basieren, ohne etwas Neues zu schaffen, sondern sich von ihrer umfangreichen Wissensbasis nähern. Da reale Datenquellen wie das öffentliche Web erschöpft werden, haben einige KI-Labors, einschließlich OpenAI, mit A-generierte Daten für das Training begonnen, obwohl nur wenige aufgrund der Risiken der Abbaumodellleistung die Daten der realen Welt vollständig aufgegeben haben. Das Papier des AI Offenlegungsprojekts behauptet, dass das GPT-4O-Modell von OpenAI, das in Chatgpt standardmäßig ist, eine starke Anerkennung von Inhalten aus Paywalled O'Reilly-Büchern zeigt, im Gegensatz zum früheren GPT-3,5-Turbo-Modell. Das Papier deutet darauf hin, dass GPT-4O wahrscheinlich in diesen nicht öffentlichen Büchern geschult wurde, obwohl O'Reilly Media keine Lizenzvereinbarung mit OpenAI hatte. Die Studie verwendete eine Methode namens DE-COP, die 2024 eingeführt wurde, um urheberrechtlich geschützte Inhalte in KI-Schulungsdaten zu erkennen. In diesem "Mitgliedschaftsschließanfall" testet ein Modell, ob ein Modell zwischen menschlich verfassten Texten und AI-generierten Paraphrasen unterscheiden kann, was auf Vorkenntnisse des Textes hinweist, wenn dies zuverlässig dies kann. Die Forscher testeten GPT-4O, GPT-3,5-Turbo und andere OpenAI-Modelle mit 13.962 Absatzauszügen aus 34 O'Reilly-Büchern und stellten fest, dass GPT-4O deutlich mehr Pay-aus-Inhalt erkannte als die älteren Modelle. Während die Autoren anerkennen, dass ihre Methode nicht narrensicher ist und dass der Paywalled -Inhalt möglicherweise von Benutzern eingeführt wurde, die in ChatGPT kopieren und einfügen, werfen die Ergebnisse Fragen zu den Datenpraktiken von OpenAI auf. In der Studie wurden OpenAIs neueste Modelle wie GPT-4,5 und Argumentationsmodelle wie O3-Mini und O1 nicht bewertet, wodurch die Möglichkeit offen wurde, dass diese möglicherweise nicht an denselben Daten geschult wurden. OpenAI hat nach entspannteren Urheberrechtsgesetzen in Bezug auf KI-Schulungsdaten gedrängt und nach Datenquellen von höherer Qualität gesucht. Das Unternehmen hat sogar Journalisten beauftragt, die Ergebnisse seiner Modelle zu verfeinern, eine Praxis in der KI -Branche, in der Experten in verschiedenen Bereichen zur Verbesserung der KI -Systeme eingestellt werden. OpenAI zahlt einige seiner Schulungsdaten, hat Lizenzvereinbarungen mit verschiedenen Inhaltsanbietern und bietet Opt-out-Mechanismen für Urheberrechtseigentümer an. Da das Unternehmen jedoch rechtliche Herausforderungen gegenüber seinen Datenpraktiken hat, haben die Ergebnisse des O'Reilly -Papiers einen Schatten über seine Operationen geworfen. OpenAI antwortete nicht auf Anfragen nach Kommentaren zur Studie.
Verwandter Artikel
OpenAI übernimmt das AI-Start-up für persönliche Finanzen Hiro OpenAI übernimmt das AI-Start-up für persönliche Finanzen Hiro OpenAI hat das Finanzstart-up Hiro Finance übernommen, wie Gründer Ethan Bloch am Montag bekannt gab. OpenAI bestätigte die Übernahme gegenüber TechCrunch. Das Start-up erhielt Unterstützung von der führenden Fintech-Venture-Capital-Firma Ribbit sowi
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Empfehlungen zu verwandten Spezialthemen
Videoerstellung Die besten KI-Videotools für Podcaster: Verwandeln Sie Audioaufnahmen in fesselnde Talking-Head-Videos
Die besten KI-Videotools für Podcaster: Verwandeln Sie Audioaufnahmen in fesselnde Talking-Head-Videos

Entdecken Sie bei XIX.AI die besten KI-Videotools für Podcaster im Jahr 2026. Unsere sorgfältig zusammengestellte Liste der Top-Anbieter umfasst leistungsstarke Tools, mit denen Sie Ihre Audioaufnahmen mühelos in ansprechende Talking-Head-Videos umwandeln können. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Schaffen Sie sich jetzt einen Vorsprung beim visuellen Storytelling.

10 Tools
xix.ai
Chatbot Erstelle deine eigene KI-Liebesgeschichte mit diesen Rollenspiel-Tools
Erstelle deine eigene KI-Liebesgeschichte mit diesen Rollenspiel-Tools

Entdecken Sie die besten KI-Tools für Rollenspiele des Jahres 2026, mit denen Sie fesselnde Geschichten erschaffen können. Die von XIX.AI zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Assistenten, die kreatives Storytelling und emotionale Tiefe ermöglichen. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests. Beginnen Sie noch heute Ihre ganz persönliche Reise.

10 Tools
xix.ai
Text-zu-Sprache Die besten KI-Sprachtools für Indie-Spieleentwickler: Sparen Sie Zeit bei der Sprachausgabe für RPGs und Visual Novels
Die besten KI-Sprachtools für Indie-Spieleentwickler: Sparen Sie Zeit bei der Sprachausgabe für RPGs und Visual Novels

Entdecken Sie die besten KI-Sprachtools für Spieleentwickler im Jahr 2026! Die von XIX.AI zusammengestellte Liste enthält erstklassige, bahnbrechende Lösungen, mit denen Sie bei der Sprachausgabe für RPGs und Visual Novels Zeit und Geld sparen. Entdecken Sie Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten, Praxistests und wöchentlich aktualisierte Rankings. Finden Sie noch heute Ihr perfektes Sprachtool!

10 Tools
xix.ai
Bildung und Lernen Die besten AI-basierten Werkzeuge für geplantes Wiederholen: Optimieren Sie Ihr Lernplan für Medizinstudenten und Jurastudenten
Die besten AI-basierten Werkzeuge für geplantes Wiederholen: Optimieren Sie Ihr Lernplan für Medizinstudenten und Jurastudenten

Entdecken Sie die besten KI-basierten Wiederholungstools für das Jahr 2026, ausgewählt von XIX.AI. Unsere hochbewerteten, bahnbrechenden Tools helfen Medizinstudenten und Jurastudenten dabei, ihre Lernpläne so zu optimieren, dass das Gelernte optimal im Gedächtnis bleibt. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von tatsächlichen Tests sowie wöchentlich aktualisierten Rankings. Entfalten Sie jetzt Ihren Vorsprung beim Lernen.

10 Tools
xix.ai
Videoerstellung Die besten KI-Plattformen für die Umwandlung von Text in Video zum Verfassen von Drehbüchern und für visuelles Storytelling
Die besten KI-Plattformen für die Umwandlung von Text in Video zum Verfassen von Drehbüchern und für visuelles Storytelling

Die besten KI-Plattformen für die Umwandlung von Text in Video im Jahr 2026: Erstklassige Tools für das Verfassen von Drehbüchern und visuelles Storytelling. Entdecken Sie leistungsstarke, bahnbrechende Lösungen, mit denen Sie Ihren Text in fesselnde Videos verwandeln können. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand unserer wöchentlich aktualisierten Ranglisten und Praxistests. Finden Sie die perfekte Plattform, um Ihre Kreativität und Produktivität zu steigern. Entdecken Sie die sorgfältig zusammengestellte Auswahl bei XIX.AI.

10 Tools
xix.ai
Chatbot KI-Multi-Agent-Orchestratoren: Gestaltung komplexer automatisierter Arbeitsabläufe mithilfe natürlicher Sprache
KI-Multi-Agent-Orchestratoren: Gestaltung komplexer automatisierter Arbeitsabläufe mithilfe natürlicher Sprache

2026 Neuestes: Entdecken Sie die besten AI-Multi-Agenten-Orchestratoren, um mithilfe natürlicher Sprache komplexe automatisierte Arbeitsabläufe zu gestalten. Unsere sorgfältig ausgewählte Liste enthält hochbewertete, leistungsstarke Plattformen für reibungslose Aufgabenerstellung und intelligente Prozessverwaltung. Vergleichen Sie kostenlose und kostenpflichtige Optionen unter Berücksichtigung praktischer Erfahrungen. Nutzen Sie die wöchentlich aktualisierten Rankings von XIX.AI, um einen Vorsprung durch künstliche Intelligenz zu erlangen.

10 Tools
xix.ai
Kommentare (42)
0/500
RichardJackson
RichardJackson 16. November 2025 15:30:37 MEZ

こんなことされてしまうと、著作権料を払って制作している出版社側はたまったもんじゃないよね…AIの学習データの透明性、もっと求められるべきだと思う。🤔

PeterNelson
PeterNelson 31. Juli 2025 13:35:39 MESZ

This is wild! OpenAI sneaking in paywalled books to train their AI? Sounds like a plot twist from a sci-fi novel. Curious how they'll dodge this one—ethics in AI is getting messier by the day! 😅

HarperJones
HarperJones 23. April 2025 04:24:27 MESZ

OpenAI가 유료 책을 이용해 AI를 훈련했다니 좀 의심스럽네요. 한편으론 AI 성능이 인상적이지만, 데이터 소스를 더 나은 방법으로 찾아야 할 것 같아요. 🤔

WalterWhite
WalterWhite 18. April 2025 21:33:48 MESZ

OpenAIの件については少し悩んでいます。O’Reillyの本を無断で使うのはちょっと気持ち悪いですが、彼らが作っているAIはかなりクールですね。次回は本の使用料を払うべきかも?🤔

BruceClark
BruceClark 18. April 2025 04:02:34 MESZ

OpenAIが有料の書籍を使ってAIを訓練しているのは少し問題があるかもしれません。でも、AIの性能は本当に素晴らしいですね。データのソースをより良い方法で見つける必要があると思います。🤔

DennisGarcia
DennisGarcia 18. April 2025 03:58:35 MESZ

I'm kinda torn about this OpenAI thing. On one hand, using those O’Reilly books without permission feels a bit off, you know? But on the other hand, the AI they're building is pretty slick! Maybe they should just pay for the books next time? 🤔

OR