Heim
OpenAI will mit seinen Audio-Ambitionen die Vorherrschaft des Bildschirms im Silicon Valley herausfordern

OpenAI treibt die Entwicklung im Bereich der Audio-KI mit Nachdruck voran, und dabei geht es um weit mehr als nur die Verbesserung der Stimme von ChatGPT. Ein aktueller Bericht von „The Information“ zeigt, dass das Unternehmen in den letzten zwei Monaten mehrere Teams aus den Bereichen Technik, Produktentwicklung und Forschung zusammengeführt hat, um seine Audiomodelle zu überarbeiten. Diese Bemühungen dienen der Vorbereitung auf ein „Audio-First“-Gerät für den privaten Gebrauch, dessen Markteinführung in etwa einem Jahr erwartet wird.
Dieser strategische Wandel spiegelt die allgemeine Richtung der Tech-Branche wider – eine Entwicklung hin zu einer Zukunft, in der Bildschirme in den Hintergrund treten und Audio zur primären Schnittstelle wird. Dank Smart-Lautsprechern sind Sprachassistenten bereits in über einem Drittel der amerikanischen Haushalte etabliert. Meta hat kürzlich eine Funktion für seine Ray-Ban-Smartbrille eingeführt, die ein Array aus fünf Mikrofonen nutzt, um Nutzern zu helfen, Gespräche in lauten Umgebungen zu hören, wodurch das Gesicht des Trägers praktisch zu einem direktionalen Hörgerät wird. Unterdessen hat Google im Juni damit begonnen, „Audio Overviews“ zu testen, die Suchergebnisse in gesprochene Zusammenfassungen umwandeln, und Tesla integriert den Grok-Chatbot von xAI in seine Fahrzeuge, um einen Gesprächsassistenten zu schaffen, der alles von der Navigation bis zur Klimasteuerung über natürliche Sprache verwaltet.
Es sind nicht nur die Branchenriesen, die auf diese Karte setzen. Eine Vielzahl von Start-ups ist mit derselben Grundüberzeugung entstanden, wenn auch mit gemischten Ergebnissen. Die Entwickler des Humane AI Pin gaben Hunderte Millionen aus, bevor ihr bildschirmloses Wearable zu einer viel zitierten Warnung wurde. Der Friend AI-Anhänger, eine Halskette, die verspricht, Ihr Leben aufzuzeichnen und Ihnen Gesellschaft zu leisten, hat erhebliche Datenschutzbedenken und existenzielle Unruhe ausgelöst. Nun entwickeln mindestens zwei Unternehmen, darunter Sandbar und eines unter der Leitung von Pebble-Gründer Eric Migicovsky, KI-Ringe, die 2026 auf den Markt kommen sollen und es den Nutzern ermöglichen, buchstäblich mit ihrer Hand zu sprechen.
Auch wenn die Designs variieren, bleibt das zugrunde liegende Prinzip dasselbe: Audio ist die Schnittstelle der Zukunft. Jede Umgebung – Ihr Zuhause, Ihr Auto, sogar Ihr Körper – wird in eine Bedienoberfläche verwandelt.
Das neue Audiomodell von OpenAI, das für Anfang 2026 erwartet wird, soll Berichten zufolge eine natürlich klingende Sprache bieten, Unterbrechungen wie ein echter Gesprächspartner handhaben und sogar sprechen, während der Nutzer redet – eine Fähigkeit, die aktuellen Modellen fehlt. Das Unternehmen soll zudem eine Reihe von Geräten planen, darunter möglicherweise Brillen oder bildschirmlose Lautsprecher, die eher wie Begleiter als bloße Werkzeuge funktionieren sollen.
Diese Entwicklung kommt nicht völlig unerwartet. Wie The Information hervorhebt, hat der ehemalige Apple-Designchef Jony Ive, der sich nach der 6,5-Milliarden-Dollar-Übernahme seines Unternehmens io im Mai der Hardware-Initiative von OpenAI angeschlossen hat, die Verringerung der Geräteabhängigkeit zur Priorität gemacht. Er sieht im Audio-First-Design eine Chance, die Mängel früherer Unterhaltungselektronik zu beheben.
Verwandter Artikel
DeepL, bekannt für seine Textübersetzungen, widmet sich nun der Sprachübersetzung
DeepL, ein Übersetzungsunternehmen, das vor allem für seine textbasierten Tools bekannt ist, hat heute eine Suite für Sprach-zu-Sprach-Übersetzungen auf den Markt gebracht, die über maßgeschneiderte A
Talats KI-Besprechungsnotizen werden auf Ihrem Gerät gespeichert, nicht in der Cloud
Granola, die KI-gestützte Notiz-App mit einem Unternehmenswert von 250 Millionen Dollar, hat bei Tech-Gründern und Risikokapitalgebern an Beliebtheit gewonnen. Ein Entwickler sieht jedoch Bedarf an ei
Der neue Roewe i6 kommt für 659.000 Yuan auf den Markt – mit Snapdragon 8155 und dem „Doubao“-Großmodell
SAIC Roewe hat heute den neuen Roewe i6 vorgestellt, eine Kompaktlimousine, die die Designsprache des Roewe D7 vollständig aufgreift. Der markante, große, senkrechte Kühlergrill und die horizontale Li
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

OpenAI treibt die Entwicklung im Bereich der Audio-KI mit Nachdruck voran, und dabei geht es um weit mehr als nur die Verbesserung der Stimme von ChatGPT. Ein aktueller Bericht von „The Information“ zeigt, dass das Unternehmen in den letzten zwei Monaten mehrere Teams aus den Bereichen Technik, Produktentwicklung und Forschung zusammengeführt hat, um seine Audiomodelle zu überarbeiten. Diese Bemühungen dienen der Vorbereitung auf ein „Audio-First“-Gerät für den privaten Gebrauch, dessen Markteinführung in etwa einem Jahr erwartet wird.
Dieser strategische Wandel spiegelt die allgemeine Richtung der Tech-Branche wider – eine Entwicklung hin zu einer Zukunft, in der Bildschirme in den Hintergrund treten und Audio zur primären Schnittstelle wird. Dank Smart-Lautsprechern sind Sprachassistenten bereits in über einem Drittel der amerikanischen Haushalte etabliert. Meta hat kürzlich eine Funktion für seine Ray-Ban-Smartbrille eingeführt, die ein Array aus fünf Mikrofonen nutzt, um Nutzern zu helfen, Gespräche in lauten Umgebungen zu hören, wodurch das Gesicht des Trägers praktisch zu einem direktionalen Hörgerät wird. Unterdessen hat Google im Juni damit begonnen, „Audio Overviews“ zu testen, die Suchergebnisse in gesprochene Zusammenfassungen umwandeln, und Tesla integriert den Grok-Chatbot von xAI in seine Fahrzeuge, um einen Gesprächsassistenten zu schaffen, der alles von der Navigation bis zur Klimasteuerung über natürliche Sprache verwaltet.
Es sind nicht nur die Branchenriesen, die auf diese Karte setzen. Eine Vielzahl von Start-ups ist mit derselben Grundüberzeugung entstanden, wenn auch mit gemischten Ergebnissen. Die Entwickler des Humane AI Pin gaben Hunderte Millionen aus, bevor ihr bildschirmloses Wearable zu einer viel zitierten Warnung wurde. Der Friend AI-Anhänger, eine Halskette, die verspricht, Ihr Leben aufzuzeichnen und Ihnen Gesellschaft zu leisten, hat erhebliche Datenschutzbedenken und existenzielle Unruhe ausgelöst. Nun entwickeln mindestens zwei Unternehmen, darunter Sandbar und eines unter der Leitung von Pebble-Gründer Eric Migicovsky, KI-Ringe, die 2026 auf den Markt kommen sollen und es den Nutzern ermöglichen, buchstäblich mit ihrer Hand zu sprechen.
Auch wenn die Designs variieren, bleibt das zugrunde liegende Prinzip dasselbe: Audio ist die Schnittstelle der Zukunft. Jede Umgebung – Ihr Zuhause, Ihr Auto, sogar Ihr Körper – wird in eine Bedienoberfläche verwandelt.
Das neue Audiomodell von OpenAI, das für Anfang 2026 erwartet wird, soll Berichten zufolge eine natürlich klingende Sprache bieten, Unterbrechungen wie ein echter Gesprächspartner handhaben und sogar sprechen, während der Nutzer redet – eine Fähigkeit, die aktuellen Modellen fehlt. Das Unternehmen soll zudem eine Reihe von Geräten planen, darunter möglicherweise Brillen oder bildschirmlose Lautsprecher, die eher wie Begleiter als bloße Werkzeuge funktionieren sollen.
Diese Entwicklung kommt nicht völlig unerwartet. Wie The Information hervorhebt, hat der ehemalige Apple-Designchef Jony Ive, der sich nach der 6,5-Milliarden-Dollar-Übernahme seines Unternehmens io im Mai der Hardware-Initiative von OpenAI angeschlossen hat, die Verringerung der Geräteabhängigkeit zur Priorität gemacht. Er sieht im Audio-First-Design eine Chance, die Mängel früherer Unterhaltungselektronik zu beheben.
DeepL, bekannt für seine Textübersetzungen, widmet sich nun der Sprachübersetzung
DeepL, ein Übersetzungsunternehmen, das vor allem für seine textbasierten Tools bekannt ist, hat heute eine Suite für Sprach-zu-Sprach-Übersetzungen auf den Markt gebracht, die über maßgeschneiderte A
Talats KI-Besprechungsnotizen werden auf Ihrem Gerät gespeichert, nicht in der Cloud
Granola, die KI-gestützte Notiz-App mit einem Unternehmenswert von 250 Millionen Dollar, hat bei Tech-Gründern und Risikokapitalgebern an Beliebtheit gewonnen. Ein Entwickler sieht jedoch Bedarf an ei
Der neue Roewe i6 kommt für 659.000 Yuan auf den Markt – mit Snapdragon 8155 und dem „Doubao“-Großmodell
SAIC Roewe hat heute den neuen Roewe i6 vorgestellt, eine Kompaktlimousine, die die Designsprache des Roewe D7 vollständig aufgreift. Der markante, große, senkrechte Kühlergrill und die horizontale Li











