Option
Heim
Nachricht
OpenAI-Befürworter für branchenspezifische KI-Benchmarks: Hier ist, warum es wichtig ist

OpenAI-Befürworter für branchenspezifische KI-Benchmarks: Hier ist, warum es wichtig ist

15. April 2025
137

OpenAI-Befürworter für branchenspezifische KI-Benchmarks: Hier ist, warum es wichtig ist

Leistungsbenchmarks sind eine gängige Funktion, wenn neue KI-Modelle veröffentlicht werden und ihre Fähigkeiten in einer Reihe allgemeiner Aufgaben wie Mathematik auf Grundschulniveau (GSM8K) oder Argumentation auf Graduiertenniveau (GPQA) demonstrieren. Diese Benchmarks berücksichtigen jedoch oft nicht die spezifischen Bedürfnisse verschiedener Branchen.

Außerdem: ChatGPT wird sich nun an alles erinnern, was Sie ihm mitteilen – wie ein echter persönlicher Assistent

OpenAI-Pionierprogramm

Um diese Lücke zu schließen, hat OpenAI das OpenAI-Pionierprogramm eingeführt, das darauf abzielt, die Entwicklung von KI-Modellen für gezielte Branchen und praktische Anwendungen zu verbessern. Diese Initiative ist ein doppelt ausgerichteter Ansatz, bei dem Unternehmen mit den Forschern von OpenAI zusammenarbeiten, um maßgeschneiderte Bewertungen zu erstellen und Modelle zu verfeinern, die spezifischen Domänen entsprechen.

wir starten das OpenAI-Pionierprogramm – eine Partnerschaft zwischen OpenAI und Unternehmen, die fortschrittliche KI-Produkte entwickeln, um (a) Modelle intensiv zu optimieren, die bei hochwertigen domänenspezifischen Aufgaben übertreffen, und (b) bessere reale Bewertungen zu entwickeln, die es Branchen ermöglichen, besser zu… https://t.co/cCvkGmYqJd

— Brad Lightcap (@bradlightcap) 9. April 2025

In einem kürzlichen Blogbeitrag wies OpenAI darauf hin, dass Branchen wie Recht, Finanzen, Versicherungen, Gesundheitswesen und Buchhaltung keine umfassende Benchmark-Quelle haben. Um dies anzugehen, plant OpenAI, mit mehreren Unternehmen in jeder Branche zusammenzuarbeiten, um diese Bewertungen zu entwickeln. Dieser Ansatz zielt nicht nur darauf ab, die Modellentwicklung zu verbessern, sondern auch das Vertrauen der Öffentlichkeit in KI-Technologien zu fördern.

Außerdem: KI stößt nicht an eine Wand, sie wird einfach zu intelligent für Benchmarks, sagt Anthropic

Forschungen haben das Fehlen branchenspezifischer Benchmarks als erhebliche Herausforderung für KI in Unternehmensumgebungen identifiziert. Zum Beispiel diskutierte Silvio Savarese, der Salesforce AI Research leitet, das Konzept der Unternehmensallgemeinen Intelligenz (EGI) in einem Blogbeitrag. EGI konzentriert sich auf fortschrittliche KI-Lösungen, die auf spezifische Geschäftsbereiche zugeschnitten sind. In einer Diskussion mit ZDNET betonte er die Bedeutung der Entwicklung von Benchmarks, die domänenspezifische Funktionen bewerten, als entscheidenden Schritt zur Erreichung von EGI.

Verfeinerung bestehender Modelle

Zusätzlich zur Erstellung neuer Bewertungen wird OpenAI mit Unternehmen zusammenarbeiten, um bestehende Modelle für drei spezifische Branchenanwendungsfälle durch eine Methode namens Verstärkungs-Feinabstimmung (RFT) zu verfeinern. OpenAI wird Anleitungen zur Implementierung von RFT bereitstellen, sodass Unternehmen dann entscheiden können, wie sie diese Modelle am besten einsetzen, die laut OpenAI für den großflächigen Einsatz bereit sein sollen.

Außerdem: Der Wettlauf um KI-Modelle ist plötzlich viel enger geworden, sagen Stanford-Wissenschaftler

Die erste Gruppe, die an diesem Programm teilnimmt, wird eine ausgewählte Anzahl von Startups umfassen, die sich auf Anwendungsfälle mit erheblichem realem Einfluss konzentrieren. Wenn Ihr Unternehmen diese Kriterien erfüllt, können Sie sich bewerben, indem Sie grundlegende Unternehmensinformationen über die Webseite des OpenAI-Pionierprogramms einreichen.

Holen Sie sich jeden Morgen die wichtigsten Geschichten in Ihren Posteingang mit unserem Tech Today-Newsletter.

Verwandter Artikel
USA verhängen Sanktionen gegen ausländische Beamte wegen Social-Media-Vorschriften USA verhängen Sanktionen gegen ausländische Beamte wegen Social-Media-Vorschriften USA stellen sich gegen globale Regelungen für digitale InhalteDas US-Außenministerium hat diese Woche eine scharfe diplomatische Rüge gegen die europäische Politik zur Kontrolle digitaler Inhalte au
Ultimativer Leitfaden für KI-gestützte YouTube-Videozusammenfassungen Ultimativer Leitfaden für KI-gestützte YouTube-Videozusammenfassungen In unserer informationsreichen digitalen Landschaft sind KI-gestützte YouTube-Videozusammenfassungen für den effizienten Konsum von Inhalten unverzichtbar geworden. Dieser ausführliche Leitfaden zeigt
Atlassian erwirbt The Browser Company für 610 Millionen Dollar, um Entwickler-Tools zu verbessern Atlassian erwirbt The Browser Company für 610 Millionen Dollar, um Entwickler-Tools zu verbessern Atlassian, der führende Anbieter von Unternehmensproduktivitätssoftware, hat Pläne zur Übernahme des innovativen Browser-Entwicklers The Browser Company im Rahmen einer bar bezahlten Transaktion im We
Kommentare (23)
0/200
WillLopez
WillLopez 12. September 2025 00:30:33 MESZ

산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐

RichardSmith
RichardSmith 27. August 2025 17:01:28 MESZ

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄

JustinHarris
JustinHarris 11. August 2025 07:00:59 MESZ

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄

JosephScott
JosephScott 23. April 2025 19:47:18 MESZ

OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

FrankJackson
FrankJackson 22. April 2025 23:27:27 MESZ

業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅

BrianThomas
BrianThomas 22. April 2025 01:41:13 MESZ

A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀

Zurück nach oben
OR