OpenAI beschleunigt Veröffentlichung von KI-Sicherheitstestdaten

OpenAI verpflichtet sich, die Ergebnisse der internen Sicherheitsbewertung seiner KI-Modelle häufiger zu veröffentlichen, und bezeichnet dies als einen Schritt zu mehr Transparenz.
Das Unternehmen startete am Mittwoch den Safety Evaluations Hub, eine spezielle Webseite, die zeigt, wie seine Modelle bei Tests zur Generierung schädlicher Inhalte, der Anfälligkeit für Jailbreaks und der Neigung zu Halluzinationen abschneiden. OpenAI erklärte, dass es diese Plattform nutzen wird, um regelmäßig Metriken zu teilen und plant, sie mit jeder größeren Modellversion zu aktualisieren.
Einführung des Safety Evaluations Hub - eine Ressource, um die Sicherheitsergebnisse unserer Modelle zu erforschen.
Während die Systemkarten die Sicherheitsmetriken beim Start teilen, wird der Hub regelmäßig als Teil unserer Bemühungen, proaktiv über Sicherheit zu kommunizieren, aktualisiert werden. https://t.co/c8NgmXlC2Y-
OpenAI (@OpenAI) May 14, 2025
"Da die Wissenschaft der KI-Evaluierung Fortschritte macht, ist es unser Ziel, Fortschritte bei der Entwicklung skalierbarerer Methoden zur Messung der Modellfähigkeit und Sicherheit zu teilen", erklärte OpenAI in einem Blogbeitrag. "Indem wir eine Auswahl unserer Sicherheitsevaluierungsergebnisse öffentlich zugänglich machen, wollen wir es einfacher machen, die Sicherheitsleistung von OpenAI-Systemen im Laufe der Zeit zu verfolgen und die Bemühungen einer breiteren Gemeinschaft zu unterstützen, die Transparenz im Bereich der KI zu verbessern."
Das Unternehmen fügte hinzu, dass es in Zukunft möglicherweise weitere Bewertungsarten in den Hub aufnehmen wird.
In letzter Zeit wurde OpenAI von einigen Ethikern kritisiert, weil es angeblich die Sicherheitstests für bestimmte Vorzeigemodelle beschleunigt und die technischen Berichte für andere nicht veröffentlicht hat. CEO Sam Altman wurde außerdem vorgeworfen, OpenAI-Führungskräfte in Bezug auf die Sicherheitsprüfung von Modellen in die Irre geführt zu haben, bevor er im November 2023 vorübergehend entlassen wurde.
Letzten Monat musste OpenAI ein Update für das Standardmodell von ChatGPT, GPT-4o, zurückziehen, nachdem Nutzer berichteten, dass es in einer übermäßig angenehmen und bestätigenden Weise reagierte. Die Social-Media-Plattform X wurde mit Screenshots überschwemmt, die zeigen, dass ChatGPT verschiedene problematische, gefährliche Entscheidungen und Ideen befürwortet.
OpenAI erklärte, dass es mehrere Korrekturen einführen werde, um ähnliche Vorfälle zu verhindern, einschließlich der Einführung einer Opt-in-Alpha-Phase" für einige Modelle, die es ausgewählten ChatGPT-Nutzern ermöglicht, vor einer breiteren Einführung zu testen und Feedback zu geben.
Techcrunch-VeranstaltungBesuchen Sie uns bei den TechCrunch Sessions: KI
Sichern Sie sich Ihr Ticket für unsere wichtigste KI-Branchenveranstaltung mit Rednern von OpenAI, Anthropic und Cohere. Für eine begrenzte Zeit können Sie einen ganzen Tag voller Expertenvorträge, Workshops und Networking für nur 292 $ erleben.
Stellen Sie bei TechCrunch Sessions aus: KI
Sichern Sie sich Ihre Ausstellungsfläche bei den TC Sessions: AI und präsentieren Sie Ihre Innovationen vor über 1.200 Entscheidungsträgern - ohne großes Budget. Dieses Angebot gilt bis zum 9. Mai oder solange der Vorrat reicht.
Berkeley, CA | 5. Juni JETZT ANMELDEN
Verwandter Artikel
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

OpenAI verpflichtet sich, die Ergebnisse der internen Sicherheitsbewertung seiner KI-Modelle häufiger zu veröffentlichen, und bezeichnet dies als einen Schritt zu mehr Transparenz.
Das Unternehmen startete am Mittwoch den Safety Evaluations Hub, eine spezielle Webseite, die zeigt, wie seine Modelle bei Tests zur Generierung schädlicher Inhalte, der Anfälligkeit für Jailbreaks und der Neigung zu Halluzinationen abschneiden. OpenAI erklärte, dass es diese Plattform nutzen wird, um regelmäßig Metriken zu teilen und plant, sie mit jeder größeren Modellversion zu aktualisieren.
Einführung des Safety Evaluations Hub - eine Ressource, um die Sicherheitsergebnisse unserer Modelle zu erforschen.
OpenAI (@OpenAI) May 14, 2025
Während die Systemkarten die Sicherheitsmetriken beim Start teilen, wird der Hub regelmäßig als Teil unserer Bemühungen, proaktiv über Sicherheit zu kommunizieren, aktualisiert werden. https://t.co/c8NgmXlC2Y-
"Da die Wissenschaft der KI-Evaluierung Fortschritte macht, ist es unser Ziel, Fortschritte bei der Entwicklung skalierbarerer Methoden zur Messung der Modellfähigkeit und Sicherheit zu teilen", erklärte OpenAI in einem Blogbeitrag. "Indem wir eine Auswahl unserer Sicherheitsevaluierungsergebnisse öffentlich zugänglich machen, wollen wir es einfacher machen, die Sicherheitsleistung von OpenAI-Systemen im Laufe der Zeit zu verfolgen und die Bemühungen einer breiteren Gemeinschaft zu unterstützen, die Transparenz im Bereich der KI zu verbessern."
Das Unternehmen fügte hinzu, dass es in Zukunft möglicherweise weitere Bewertungsarten in den Hub aufnehmen wird.
In letzter Zeit wurde OpenAI von einigen Ethikern kritisiert, weil es angeblich die Sicherheitstests für bestimmte Vorzeigemodelle beschleunigt und die technischen Berichte für andere nicht veröffentlicht hat. CEO Sam Altman wurde außerdem vorgeworfen, OpenAI-Führungskräfte in Bezug auf die Sicherheitsprüfung von Modellen in die Irre geführt zu haben, bevor er im November 2023 vorübergehend entlassen wurde.
Letzten Monat musste OpenAI ein Update für das Standardmodell von ChatGPT, GPT-4o, zurückziehen, nachdem Nutzer berichteten, dass es in einer übermäßig angenehmen und bestätigenden Weise reagierte. Die Social-Media-Plattform X wurde mit Screenshots überschwemmt, die zeigen, dass ChatGPT verschiedene problematische, gefährliche Entscheidungen und Ideen befürwortet.
OpenAI erklärte, dass es mehrere Korrekturen einführen werde, um ähnliche Vorfälle zu verhindern, einschließlich der Einführung einer Opt-in-Alpha-Phase" für einige Modelle, die es ausgewählten ChatGPT-Nutzern ermöglicht, vor einer breiteren Einführung zu testen und Feedback zu geben.
Techcrunch-VeranstaltungBesuchen Sie uns bei den TechCrunch Sessions: KI
Sichern Sie sich Ihr Ticket für unsere wichtigste KI-Branchenveranstaltung mit Rednern von OpenAI, Anthropic und Cohere. Für eine begrenzte Zeit können Sie einen ganzen Tag voller Expertenvorträge, Workshops und Networking für nur 292 $ erleben.
Stellen Sie bei TechCrunch Sessions aus: KI
Sichern Sie sich Ihre Ausstellungsfläche bei den TC Sessions: AI und präsentieren Sie Ihre Innovationen vor über 1.200 Entscheidungsträgern - ohne großes Budget. Dieses Angebot gilt bis zum 9. Mai oder solange der Vorrat reicht.
Berkeley, CA | 5. Juni JETZT ANMELDEN
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um





Heim






