OpenAI präsentiert die Fähigkeiten der Sprachintelligenz in seiner API

OpenAI gab am Donnerstag bekannt, dass seine API nun mehrere neue Funktionen für Sprachintelligenz enthält, die entwickelt wurden, um Entwicklern zu helfen, Anwendungen zu erstellen, die in der Lage sind, Gespräche zu führen, transkribieren und übersetzen.
Das neue Modell GPT-Realtime-2 ist ein weiteres Sprachmodell, das entwickelt wurde, um eine realistische Stimmsimulation zu erzeugen, die in der Lage ist, mit Benutzern zu kommunizieren. Im Gegensatz zu seinem Vorgänger (GPT-Realtime-1.5) integriert diese Version jedoch Schlussfolgerungsfähigkeiten auf GPT-5-Niveau, die OpenAI so entwickelt hat, um damit komplexere Anfragen der Benutzer zu bewältigen.
Außerdem wird GPT-Realtime-Translate veröffentlicht, welches – wie der Name schon sagt – Echtzeitübersetzungsdienste anbietet, die dem Gespräch des Benutzers in Echtzeit folgen. Diese Funktion unterstützt mehr als 70 Eingabesprachen und 13 Ausgabesprachen.
Schließlich hat OpenAI eine neue Transkriptionsfunktion namens GPT-Realtime-Whisper eingeführt, die eine Live-Funktion von Sprache zu Text bietet und Wörter während des Gesprächs aufzeichnet.
„Zusammen ermöglichen uns diese neuen Modelle, Echtzeit-Audio von einfachen Anruf-und-Antwort-Systemen zu Sprachoberflächen weiterzuentwickeln, die tatsächlich in der Lage sind, Aufgaben auszuführen: zuzuhören, zu urteilen, zu übersetzen, zu transkribieren und im Laufe eines Gesprächs Maßnahmen zu ergreifen“, so das Unternehmen.
Wer profitiert von diesen Updates? Offensichtlich sind Unternehmen, die ihre Kundendienstleistungen erweitern möchten, ein Zielmarkt. OpenAI weist jedoch auch darauf hin, dass die neuen Funktionen in vielen Bereichen eingesetzt werden können – darunter Bildung, Medien, Veranstaltungen und Kreativplattformen.
So nützlich diese Tools aus Sicht von Unternehmen auch sein mögen, besteht auch das Potenzial für Fehlanwendung. OpenAI betont, dass es Sicherheitsmaßnahmen ergriffen hat, um zu verhindern, dass die neuen Funktionen zum Versenden von Spam, zur Betrugstätigkeit oder zu anderen Formen des Online-Betrugs genutzt werden. Im System sind spezifische Mechanismen integriert, sodass „Gespräche unterbrochen werden können, wenn sie als Verstoß gegen unsere Richtlinien für schädliches Inhaltsmaterial erkannt werden“, so OpenAI.
Alle neuen Sprachmodelle sind in OpenAI’s Realtime API enthalten. Translate und Whisper werden nach der Anzahl der Minuten abgerechnet, während GPT-Realtime-2 nach dem Verbrauch von Tokens berechnet wird.
Verwandter Artikel
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Das Pentagon schließt Vereinbarungen mit Nvidia, Microsoft und AWS ab, um KI in gesicherten Netzwerken einzusetzen.
Nachdem zuvor Einigungen mit Google, SpaceX und OpenAI erreicht worden waren, gab das US-Verteidigungsministerium am Freitag bekannt, dass es nun auch Vereinbarungen mit Nvidia, Microsoft, Amazon Web Services und Reflection AI unterzeichnet hat, um d
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

OpenAI gab am Donnerstag bekannt, dass seine API nun mehrere neue Funktionen für Sprachintelligenz enthält, die entwickelt wurden, um Entwicklern zu helfen, Anwendungen zu erstellen, die in der Lage sind, Gespräche zu führen, transkribieren und übersetzen.
Das neue Modell GPT-Realtime-2 ist ein weiteres Sprachmodell, das entwickelt wurde, um eine realistische Stimmsimulation zu erzeugen, die in der Lage ist, mit Benutzern zu kommunizieren. Im Gegensatz zu seinem Vorgänger (GPT-Realtime-1.5) integriert diese Version jedoch Schlussfolgerungsfähigkeiten auf GPT-5-Niveau, die OpenAI so entwickelt hat, um damit komplexere Anfragen der Benutzer zu bewältigen.
Außerdem wird GPT-Realtime-Translate veröffentlicht, welches – wie der Name schon sagt – Echtzeitübersetzungsdienste anbietet, die dem Gespräch des Benutzers in Echtzeit folgen. Diese Funktion unterstützt mehr als 70 Eingabesprachen und 13 Ausgabesprachen.
Schließlich hat OpenAI eine neue Transkriptionsfunktion namens GPT-Realtime-Whisper eingeführt, die eine Live-Funktion von Sprache zu Text bietet und Wörter während des Gesprächs aufzeichnet.
„Zusammen ermöglichen uns diese neuen Modelle, Echtzeit-Audio von einfachen Anruf-und-Antwort-Systemen zu Sprachoberflächen weiterzuentwickeln, die tatsächlich in der Lage sind, Aufgaben auszuführen: zuzuhören, zu urteilen, zu übersetzen, zu transkribieren und im Laufe eines Gesprächs Maßnahmen zu ergreifen“, so das Unternehmen.
Wer profitiert von diesen Updates? Offensichtlich sind Unternehmen, die ihre Kundendienstleistungen erweitern möchten, ein Zielmarkt. OpenAI weist jedoch auch darauf hin, dass die neuen Funktionen in vielen Bereichen eingesetzt werden können – darunter Bildung, Medien, Veranstaltungen und Kreativplattformen.
So nützlich diese Tools aus Sicht von Unternehmen auch sein mögen, besteht auch das Potenzial für Fehlanwendung. OpenAI betont, dass es Sicherheitsmaßnahmen ergriffen hat, um zu verhindern, dass die neuen Funktionen zum Versenden von Spam, zur Betrugstätigkeit oder zu anderen Formen des Online-Betrugs genutzt werden. Im System sind spezifische Mechanismen integriert, sodass „Gespräche unterbrochen werden können, wenn sie als Verstoß gegen unsere Richtlinien für schädliches Inhaltsmaterial erkannt werden“, so OpenAI.
Alle neuen Sprachmodelle sind in OpenAI’s Realtime API enthalten. Translate und Whisper werden nach der Anzahl der Minuten abgerechnet, während GPT-Realtime-2 nach dem Verbrauch von Tokens berechnet wird.
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Das Pentagon schließt Vereinbarungen mit Nvidia, Microsoft und AWS ab, um KI in gesicherten Netzwerken einzusetzen.
Nachdem zuvor Einigungen mit Google, SpaceX und OpenAI erreicht worden waren, gab das US-Verteidigungsministerium am Freitag bekannt, dass es nun auch Vereinbarungen mit Nvidia, Microsoft, Amazon Web Services und Reflection AI unterzeichnet hat, um d





Heim






