Maison
Les ambitions d'OpenAI dans le domaine de l'audio remettent en cause la domination des écrans dans la Silicon Valley

OpenAI se lance à fond dans l'IA audio, et cela va bien au-delà d'une simple amélioration de la voix de ChatGPT. Un récent article publié par The Information révèle qu'au cours des deux derniers mois, l'entreprise a regroupé plusieurs équipes d'ingénierie, de produit et de recherche afin de repenser ses modèles audio. Cette initiative s'inscrit dans la préparation d'un appareil personnel axé sur l'audio dont le lancement est prévu dans environ un an.
Ce changement stratégique reflète l'orientation générale du secteur technologique : une évolution vers un avenir où les écrans passeront au second plan et où l'audio deviendra l'interface principale. Les enceintes connectées ont déjà permis l'installation d'assistants vocaux dans plus d'un tiers des foyers américains. Meta a récemment introduit une fonctionnalité pour ses lunettes intelligentes Ray-Ban qui utilise un ensemble de cinq microphones pour aider les utilisateurs à entendre les conversations dans des environnements bruyants, transformant ainsi le visage de la personne qui les porte en un dispositif d'écoute directionnel. Parallèlement, Google a commencé à tester les « Audio Overviews » en juin, convertissant les résultats de recherche en résumés vocaux, et Tesla intègre le chatbot Grok de xAI dans ses véhicules pour créer un assistant conversationnel qui gère tout, de la navigation à la climatisation, par la parole naturelle.
Les géants du secteur ne sont pas les seuls à faire ce pari. Un large éventail de start-ups a vu le jour avec la même conviction fondamentale, bien que les résultats soient mitigés. Les créateurs de l’Humane AI Pin ont dépensé des centaines de millions avant que leur appareil portable sans écran ne devienne un exemple édifiant largement cité. Le pendentif Friend AI, un collier qui promet d’enregistrer votre vie et de vous tenir compagnie, a soulevé d’importantes préoccupations en matière de vie privée et un malaise existentiel. Aujourd’hui, au moins deux entreprises, dont Sandbar et une dirigée par le fondateur de Pebble, Eric Migicovsky, développent des bagues IA dont le lancement est prévu en 2026, permettant aux utilisateurs de parler littéralement à leur main.
Si les designs varient, le principe sous-jacent reste le même : l’audio est l’interface de demain. Chaque environnement — votre maison, votre voiture, voire votre propre personne — se transforme en interface de commande.
Le nouveau modèle audio d’OpenAI, attendu début 2026, devrait offrir une voix plus naturelle, gérer les interruptions comme un véritable interlocuteur et même parler pendant que l’utilisateur s’exprime — une capacité dont les modèles actuels sont dépourvus. L’entreprise aurait également prévu une gamme d’appareils, comprenant potentiellement des lunettes ou des haut-parleurs sans écran, conçus pour fonctionner davantage comme des compagnons que comme de simples outils.
Cette évolution n’est pas tout à fait inattendue. Comme le souligne The Information, l’ancien directeur du design d’Apple, Jony Ive, qui a rejoint l’initiative matérielle d’OpenAI après le rachat de sa société io pour 6,5 milliards de dollars en mai, a donné la priorité à la réduction de la dépendance vis-à-vis des appareils. Il considère la conception axée sur l’audio comme une opportunité de corriger les lacunes des précédents appareils électroniques grand public.
Article connexe
Claude a été utilisé pour créer des paquets npm malveillants : plus de 670 paquets compromis menacent l'open source
Un incident de cybersécurité récent met en lumière la manière dont les grands modèles linguistiques (LLM) sont détournés pour développer des logiciels malveillants. Le chercheur en sécurité Sibi Moosa
Reliance dévoile un plan d'investissement de 110 milliards de dollars dans l'IA alors que l'Inde accélère sa transition technologique
Mukesh Ambani, le président milliardaire du conglomérat indien Reliance, a annoncé jeudi un plan de 10 000 milliards de roupies (environ 110 milliards de dollars) visant à mettre en place une infrastr
Zhiyuan WITA met fin à son projet d'interaction avec des robots « nus » en déposant sa première demande d'agrément
Le secteur de l'intelligence incarnée a franchi une étape importante. Selon la dernière annonce de l'Administration du cyberespace de Shanghai, le grand modèle WITA développé par Zhiyuan a mené à bien
Recommandations de sujets spéciaux liés
commentaires (0)

OpenAI se lance à fond dans l'IA audio, et cela va bien au-delà d'une simple amélioration de la voix de ChatGPT. Un récent article publié par The Information révèle qu'au cours des deux derniers mois, l'entreprise a regroupé plusieurs équipes d'ingénierie, de produit et de recherche afin de repenser ses modèles audio. Cette initiative s'inscrit dans la préparation d'un appareil personnel axé sur l'audio dont le lancement est prévu dans environ un an.
Ce changement stratégique reflète l'orientation générale du secteur technologique : une évolution vers un avenir où les écrans passeront au second plan et où l'audio deviendra l'interface principale. Les enceintes connectées ont déjà permis l'installation d'assistants vocaux dans plus d'un tiers des foyers américains. Meta a récemment introduit une fonctionnalité pour ses lunettes intelligentes Ray-Ban qui utilise un ensemble de cinq microphones pour aider les utilisateurs à entendre les conversations dans des environnements bruyants, transformant ainsi le visage de la personne qui les porte en un dispositif d'écoute directionnel. Parallèlement, Google a commencé à tester les « Audio Overviews » en juin, convertissant les résultats de recherche en résumés vocaux, et Tesla intègre le chatbot Grok de xAI dans ses véhicules pour créer un assistant conversationnel qui gère tout, de la navigation à la climatisation, par la parole naturelle.
Les géants du secteur ne sont pas les seuls à faire ce pari. Un large éventail de start-ups a vu le jour avec la même conviction fondamentale, bien que les résultats soient mitigés. Les créateurs de l’Humane AI Pin ont dépensé des centaines de millions avant que leur appareil portable sans écran ne devienne un exemple édifiant largement cité. Le pendentif Friend AI, un collier qui promet d’enregistrer votre vie et de vous tenir compagnie, a soulevé d’importantes préoccupations en matière de vie privée et un malaise existentiel. Aujourd’hui, au moins deux entreprises, dont Sandbar et une dirigée par le fondateur de Pebble, Eric Migicovsky, développent des bagues IA dont le lancement est prévu en 2026, permettant aux utilisateurs de parler littéralement à leur main.
Si les designs varient, le principe sous-jacent reste le même : l’audio est l’interface de demain. Chaque environnement — votre maison, votre voiture, voire votre propre personne — se transforme en interface de commande.
Le nouveau modèle audio d’OpenAI, attendu début 2026, devrait offrir une voix plus naturelle, gérer les interruptions comme un véritable interlocuteur et même parler pendant que l’utilisateur s’exprime — une capacité dont les modèles actuels sont dépourvus. L’entreprise aurait également prévu une gamme d’appareils, comprenant potentiellement des lunettes ou des haut-parleurs sans écran, conçus pour fonctionner davantage comme des compagnons que comme de simples outils.
Cette évolution n’est pas tout à fait inattendue. Comme le souligne The Information, l’ancien directeur du design d’Apple, Jony Ive, qui a rejoint l’initiative matérielle d’OpenAI après le rachat de sa société io pour 6,5 milliards de dollars en mai, a donné la priorité à la réduction de la dépendance vis-à-vis des appareils. Il considère la conception axée sur l’audio comme une opportunité de corriger les lacunes des précédents appareils électroniques grand public.
Claude a été utilisé pour créer des paquets npm malveillants : plus de 670 paquets compromis menacent l'open source
Un incident de cybersécurité récent met en lumière la manière dont les grands modèles linguistiques (LLM) sont détournés pour développer des logiciels malveillants. Le chercheur en sécurité Sibi Moosa
Reliance dévoile un plan d'investissement de 110 milliards de dollars dans l'IA alors que l'Inde accélère sa transition technologique
Mukesh Ambani, le président milliardaire du conglomérat indien Reliance, a annoncé jeudi un plan de 10 000 milliards de roupies (environ 110 milliards de dollars) visant à mettre en place une infrastr
Zhiyuan WITA met fin à son projet d'interaction avec des robots « nus » en déposant sa première demande d'agrément
Le secteur de l'intelligence incarnée a franchi une étape importante. Selon la dernière annonce de l'Administration du cyberespace de Shanghai, le grand modèle WITA développé par Zhiyuan a mené à bien











