OpenAI dévoile ses capacités en matière d'intelligence vocale à travers son API

OpenAI a annoncé jeudi que son API intègre désormais plusieurs nouvelles fonctionnalités d’intelligence vocale, conçues pour aider les développeurs à créer des applications capables de parler, de transcrire et de traduire des conversations.
Le nouveau modèle vocal GPT-Realtime-2 est une autre solution développée par l’entreprise ; il permet de générer des simulations vocales réalistes qui peuvent engager en conversation les utilisateurs. Contrairement à son prédécesseur (GPT-Realtime-1.5), cette version intègre des capacités de raisonnement du niveau de GPT-5, ce qui, selon OpenAI, permet de gérer des demandes plus complexes de la part des utilisateurs.
L’entreprise lance également GPT-Realtime-Translate, un service de traduction en temps réel qui suit le rythme de la conversation de l’utilisateur. Cette fonctionnalité prend en charge plus de 70 langues d’entrée et 13 langues de sortie.
Enfin, OpenAI a introduit GPT-Realtime-Whisper, une fonctionnalité de transcription en temps réel qui permet de convertir en texte les paroles prononcées en direct.
“ Ensemble, ces nouveaux modèles permettent de passer d’interactions audio simples basées sur des questions-réponses à des interfaces vocales capables d’exécuter des tâches concrètes : écouter, raisonner, traduire, transcrire et agir au cours d’une conversation”, a déclaré l’entreprise.
Qui bénéficiera de ces mises à jour ? Les entreprises souhaitant améliorer leurs services client sont une cible évidente. Cependant, OpenAI souligne que ces nouvelles fonctionnalités pourront être utiles dans de nombreux domaines, tels que l’éducation, les médias, les événements et les plateformes créatives.
Bien que ces outils soient très pratiques du point de vue des entreprises, il existe un risque de leur utilisation abusive. OpenAI a mis en place des mesures pour empêcher que ses nouvelles fonctionnalités ne soient utilisées à des fins de spam, de fraude ou d’autres formes d’abus en ligne. Des mécanismes spécifiques ont été intégrés au système afin de “stopper les conversations si elles sont détectées comme violant nos règles concernant le contenu nuisible”, selon OpenAI.
Tous ces nouveaux modèles vocaux sont inclus dans l’API Realtime d’OpenAI. Translate et Whisper sont facturés par minute, tandis que GPT-Realtime-2 est facturé en fonction de la consommation de tokens.
Article connexe
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc
Le Pentagone signe des accords avec Nvidia, Microsoft et AWS pour déployer l’intelligence artificielle sur les réseaux classés.
Après avoir précédemment conclu des accords avec Google, SpaceX et OpenAI, le Département de la Défense américain a annoncé vendredi qu’il avait signé des contrats avec Nvidia, Microsoft, Amazon Web Services et Reflection AI pour mettre en œuvre leur
Les ambitions de l'Inde en matière d'IA se heurtent aux difficultés de l'économie des créateurs en matière de recettes publicitaires
Chargement du lecteur…L'économie des créateurs évolue rapidement, et les revenus publicitaires ne suffisent plus à eux seuls. Les YouTubers lancent des gammes de produits, rachètent des start-ups et b
Recommandations de sujets spéciaux liés
commentaires (0)

OpenAI a annoncé jeudi que son API intègre désormais plusieurs nouvelles fonctionnalités d’intelligence vocale, conçues pour aider les développeurs à créer des applications capables de parler, de transcrire et de traduire des conversations.
Le nouveau modèle vocal GPT-Realtime-2 est une autre solution développée par l’entreprise ; il permet de générer des simulations vocales réalistes qui peuvent engager en conversation les utilisateurs. Contrairement à son prédécesseur (GPT-Realtime-1.5), cette version intègre des capacités de raisonnement du niveau de GPT-5, ce qui, selon OpenAI, permet de gérer des demandes plus complexes de la part des utilisateurs.
L’entreprise lance également GPT-Realtime-Translate, un service de traduction en temps réel qui suit le rythme de la conversation de l’utilisateur. Cette fonctionnalité prend en charge plus de 70 langues d’entrée et 13 langues de sortie.
Enfin, OpenAI a introduit GPT-Realtime-Whisper, une fonctionnalité de transcription en temps réel qui permet de convertir en texte les paroles prononcées en direct.
“ Ensemble, ces nouveaux modèles permettent de passer d’interactions audio simples basées sur des questions-réponses à des interfaces vocales capables d’exécuter des tâches concrètes : écouter, raisonner, traduire, transcrire et agir au cours d’une conversation”, a déclaré l’entreprise.
Qui bénéficiera de ces mises à jour ? Les entreprises souhaitant améliorer leurs services client sont une cible évidente. Cependant, OpenAI souligne que ces nouvelles fonctionnalités pourront être utiles dans de nombreux domaines, tels que l’éducation, les médias, les événements et les plateformes créatives.
Bien que ces outils soient très pratiques du point de vue des entreprises, il existe un risque de leur utilisation abusive. OpenAI a mis en place des mesures pour empêcher que ses nouvelles fonctionnalités ne soient utilisées à des fins de spam, de fraude ou d’autres formes d’abus en ligne. Des mécanismes spécifiques ont été intégrés au système afin de “stopper les conversations si elles sont détectées comme violant nos règles concernant le contenu nuisible”, selon OpenAI.
Tous ces nouveaux modèles vocaux sont inclus dans l’API Realtime d’OpenAI. Translate et Whisper sont facturés par minute, tandis que GPT-Realtime-2 est facturé en fonction de la consommation de tokens.
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc
Le Pentagone signe des accords avec Nvidia, Microsoft et AWS pour déployer l’intelligence artificielle sur les réseaux classés.
Après avoir précédemment conclu des accords avec Google, SpaceX et OpenAI, le Département de la Défense américain a annoncé vendredi qu’il avait signé des contrats avec Nvidia, Microsoft, Amazon Web Services et Reflection AI pour mettre en œuvre leur
Les ambitions de l'Inde en matière d'IA se heurtent aux difficultés de l'économie des créateurs en matière de recettes publicitaires
Chargement du lecteur…L'économie des créateurs évolue rapidement, et les revenus publicitaires ne suffisent plus à eux seuls. Les YouTubers lancent des gammes de produits, rachètent des start-ups et b





Maison






