Option
Heim
Nachricht
OpenAI-Befürworter für branchenspezifische KI-Benchmarks: Hier ist, warum es wichtig ist

OpenAI-Befürworter für branchenspezifische KI-Benchmarks: Hier ist, warum es wichtig ist

15. April 2025
120

OpenAI-Befürworter für branchenspezifische KI-Benchmarks: Hier ist, warum es wichtig ist

Leistungsbenchmarks sind eine gängige Funktion, wenn neue KI-Modelle veröffentlicht werden und ihre Fähigkeiten in einer Reihe allgemeiner Aufgaben wie Mathematik auf Grundschulniveau (GSM8K) oder Argumentation auf Graduiertenniveau (GPQA) demonstrieren. Diese Benchmarks berücksichtigen jedoch oft nicht die spezifischen Bedürfnisse verschiedener Branchen.

Außerdem: ChatGPT wird sich nun an alles erinnern, was Sie ihm mitteilen – wie ein echter persönlicher Assistent

OpenAI-Pionierprogramm

Um diese Lücke zu schließen, hat OpenAI das OpenAI-Pionierprogramm eingeführt, das darauf abzielt, die Entwicklung von KI-Modellen für gezielte Branchen und praktische Anwendungen zu verbessern. Diese Initiative ist ein doppelt ausgerichteter Ansatz, bei dem Unternehmen mit den Forschern von OpenAI zusammenarbeiten, um maßgeschneiderte Bewertungen zu erstellen und Modelle zu verfeinern, die spezifischen Domänen entsprechen.

wir starten das OpenAI-Pionierprogramm – eine Partnerschaft zwischen OpenAI und Unternehmen, die fortschrittliche KI-Produkte entwickeln, um (a) Modelle intensiv zu optimieren, die bei hochwertigen domänenspezifischen Aufgaben übertreffen, und (b) bessere reale Bewertungen zu entwickeln, die es Branchen ermöglichen, besser zu… https://t.co/cCvkGmYqJd

— Brad Lightcap (@bradlightcap) 9. April 2025

In einem kürzlichen Blogbeitrag wies OpenAI darauf hin, dass Branchen wie Recht, Finanzen, Versicherungen, Gesundheitswesen und Buchhaltung keine umfassende Benchmark-Quelle haben. Um dies anzugehen, plant OpenAI, mit mehreren Unternehmen in jeder Branche zusammenzuarbeiten, um diese Bewertungen zu entwickeln. Dieser Ansatz zielt nicht nur darauf ab, die Modellentwicklung zu verbessern, sondern auch das Vertrauen der Öffentlichkeit in KI-Technologien zu fördern.

Außerdem: KI stößt nicht an eine Wand, sie wird einfach zu intelligent für Benchmarks, sagt Anthropic

Forschungen haben das Fehlen branchenspezifischer Benchmarks als erhebliche Herausforderung für KI in Unternehmensumgebungen identifiziert. Zum Beispiel diskutierte Silvio Savarese, der Salesforce AI Research leitet, das Konzept der Unternehmensallgemeinen Intelligenz (EGI) in einem Blogbeitrag. EGI konzentriert sich auf fortschrittliche KI-Lösungen, die auf spezifische Geschäftsbereiche zugeschnitten sind. In einer Diskussion mit ZDNET betonte er die Bedeutung der Entwicklung von Benchmarks, die domänenspezifische Funktionen bewerten, als entscheidenden Schritt zur Erreichung von EGI.

Verfeinerung bestehender Modelle

Zusätzlich zur Erstellung neuer Bewertungen wird OpenAI mit Unternehmen zusammenarbeiten, um bestehende Modelle für drei spezifische Branchenanwendungsfälle durch eine Methode namens Verstärkungs-Feinabstimmung (RFT) zu verfeinern. OpenAI wird Anleitungen zur Implementierung von RFT bereitstellen, sodass Unternehmen dann entscheiden können, wie sie diese Modelle am besten einsetzen, die laut OpenAI für den großflächigen Einsatz bereit sein sollen.

Außerdem: Der Wettlauf um KI-Modelle ist plötzlich viel enger geworden, sagen Stanford-Wissenschaftler

Die erste Gruppe, die an diesem Programm teilnimmt, wird eine ausgewählte Anzahl von Startups umfassen, die sich auf Anwendungsfälle mit erheblichem realem Einfluss konzentrieren. Wenn Ihr Unternehmen diese Kriterien erfüllt, können Sie sich bewerben, indem Sie grundlegende Unternehmensinformationen über die Webseite des OpenAI-Pionierprogramms einreichen.

Holen Sie sich jeden Morgen die wichtigsten Geschichten in Ihren Posteingang mit unserem Tech Today-Newsletter.

Verwandter Artikel
Qodo Partnerschaft mit Google Cloud zur Bereitstellung kostenloser KI-Code-Review-Tools für Entwickler Qodo Partnerschaft mit Google Cloud zur Bereitstellung kostenloser KI-Code-Review-Tools für Entwickler Qodo, ein in Israel ansässiges KI-Startup für Codierung, das sich auf Codequalität konzentriert, hat eine Partnerschaft mit Google Cloud gestartet, um die Integrität von KI-generiertem Softwarecode zu
DeepMind's KI sichert Gold bei der Mathematik-Olympiade 2025 DeepMind's KI sichert Gold bei der Mathematik-Olympiade 2025 DeepMind's KI hat einen beeindruckenden Sprung im mathematischen Denken gemacht und eine Goldmedaille bei der Internationalen Mathematik-Olympiade (IMO) 2025 gewonnen, nur ein Jahr nach dem Erhalt der
AI-betriebener Parallax Maker: Erstellen dynamischer 2.5D-Animationen AI-betriebener Parallax Maker: Erstellen dynamischer 2.5D-Animationen Verwandeln Sie statische Bilder in fesselnde 2.5D-Animationen mit Parallax Maker. Dieses Open-Source-Tool befähigt Künstler und Spieleentwickler, Tiefe und Bewegung in ihre Werke einzubringen. Durch d
Kommentare (21)
0/200
JustinHarris
JustinHarris 11. August 2025 07:00:59 MESZ

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄

JosephScott
JosephScott 23. April 2025 19:47:18 MESZ

OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

FrankJackson
FrankJackson 22. April 2025 23:27:27 MESZ

業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅

BrianThomas
BrianThomas 22. April 2025 01:41:13 MESZ

A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀

ChristopherTaylor
ChristopherTaylor 21. April 2025 00:32:37 MESZ

¡Qué genial que OpenAI abogue por benchmarks de IA específicos de la industria! Ya era hora de que se centraran en las necesidades reales de cada sector, no solo en tareas genéricas. Estoy emocionado de ver cómo se desarrolla esto. ¡A por ello! 🚀

JonathanKing
JonathanKing 20. April 2025 06:12:27 MESZ

Me encanta cómo este herramienta enfoca los benchmarks de IA en sectores específicos. ¡Es genial para ver dónde puede tener un impacto real la IA! Aunque la interfaz podría ser más intuitiva, es esencial para cualquier persona en el campo de la IA. ¡Recomendado! 🌟

Zurück nach oben
OR