DeepL, bekannt für seine Textübersetzungen, widmet sich nun der Sprachübersetzung

DeepL, ein Übersetzungsunternehmen, das vor allem für seine textbasierten Tools bekannt ist, hat heute eine Suite für Sprach-zu-Sprach-Übersetzungen auf den Markt gebracht, die über maßgeschneiderte Anwendungen Szenarien wie Besprechungen, Gespräche über Mobilgeräte und das Internet sowie Gruppendiskussionen für Mitarbeiter mit Kundenkontakt abdeckt. Das Unternehmen stellte zudem eine API vor, die es externen Entwicklern und Unternehmen ermöglicht, auf der DeepL-Technologie für maßgeschneiderte Anwendungsfälle wie Callcenter aufzubauen.
„Nachdem wir uns so viele Jahre auf die Textübersetzung konzentriert hatten, war die Sprachübersetzung für uns ein logischer nächster Schritt“, erklärte DeepL-CEO Jarek Kutylowski in einem Interview mit TechCrunch. „Wir haben bei der Übersetzung von Texten und Dokumenten erhebliche Fortschritte erzielt. Aber wir hatten das Gefühl, dass es kein wirklich gutes Produkt für die Echtzeit-Sprachübersetzung gab.“
Kutylowski erklärte, dass die größte Herausforderung bei der Entwicklung eines Echtzeit-Übersetzungsprodukts darin bestehe, das richtige Gleichgewicht zwischen der Reduzierung der Latenz – der Verzögerung zwischen dem Sprechen und dem Hören des übersetzten Audios – und der Aufrechterhaltung einer hohen Genauigkeit zu finden.
DeepL veröffentlicht Add-ons für Plattformen wie Zoom und Microsoft Teams, bei denen Zuhörer entweder Echtzeitübersetzungen hören können, während andere in ihrer Muttersprache sprechen, oder den in Echtzeit übersetzten Text auf dem Bildschirm verfolgen können. Dieses Programm ist derzeit im Early Access verfügbar, und das Unternehmen lädt Organisationen ein, sich auf eine Warteliste setzen zu lassen. DeepL bietet außerdem ein Produkt für mobile und webbasierte Gespräche an, unabhängig davon, ob diese persönlich oder aus der Ferne stattfinden.
DeepL ermöglicht es Nutzern zudem, an Gruppengesprächen in Umgebungen wie Schulungen oder Workshops teilzunehmen, wobei die Teilnehmer über einen QR-Code beitreten können.
DeepL gibt an, dass seine Voice-to-Voice-Technologie benutzerdefiniertes Vokabular lernen und sich daran anpassen kann, einschließlich branchenspezifischer Begriffe sowie Firmen- und Personennamen.
Kutylowski merkte an, dass KI den Kundenservice in den kommenden Jahren neu gestalten werde. Er wies darauf hin, dass eine Übersetzungsebene Unternehmen dabei helfe, Support in Sprachen anzubieten, in denen qualifiziertes Personal rar und teuer in der Einstellung sei.
Das Unternehmen gibt an, den gesamten Voice-to-Voice-Stack zu kontrollieren. Das aktuelle System wandelt jedoch Sprache in Text um, wendet die Übersetzung an und wandelt den Text anschließend wieder in Sprache um. DeepL ist überzeugt, dass seine jahrelange Arbeit im Bereich der Textübersetzung ihm einen Vorteil bei der Übersetzungsqualität verschafft. Mit Blick auf die Zukunft strebt das Unternehmen die Entwicklung eines durchgängigen Sprachübersetzungsmodells an, das den Text-Schritt vollständig umgeht.
DeepL steht im Wettbewerb mit mehreren gut finanzierten Start-ups, die in verwandten Bereichen tätig sind. Sanas, das im vergangenen Jahr 65 Millionen US-Dollar von Quadrille Capital und Teleperformance eingesammelt hat, nutzt KI, um den Akzent eines Sprechers in Echtzeit zu verändern – ein Tool, das in erster Linie auf Callcenter-Mitarbeiter abzielt.
Das in Dubai ansässige Unternehmen Camb.AI konzentriert sich auf Sprachsynthese und -übersetzung für Medien- und Unterhaltungsunternehmen, darunter Amazon Web Services, und unterstützt diese dabei, Videoinhalte in großem Umfang zu synchronisieren und zu lokalisieren.
Palabra, unterstützt von der Firma Seven Seven Six des Reddit-Mitbegründers Alexis Ohanian, entwickelt eine Echtzeit-Sprachübersetzungs-Engine, die sowohl die Bedeutung als auch die ursprüngliche Stimme des Sprechers bewahren soll, wodurch es in direkteren Wettbewerb zu dem tritt, was DeepL derzeit entwickelt.
Verwandter Artikel
ElevenLabs gibt BlackRock, Jamie Foxx und Eva Longoria als neue Investoren bekannt
Das Sprach-KI-Unternehmen ElevenLabs hat weitere Investoren für seine im Februar angekündigte Serie-D-Finanzierungsrunde in Höhe von 500 Millionen US-Dollar bekannt gegeben. Dazu gehören institutionel
Mistral stellt ein Open-Source-Modell zur Sprachgenerierung vor
Das französische KI-Unternehmen Mistral hat am Donnerstag ein neues Open-Source-Text-to-Speech-Modell vorgestellt, das für Sprach-KI-Assistenten und Unternehmensanwendungen wie den Kundensupport konzi
Die besten KI-Diktat-Apps: Expertenbewertungen und Rankings
KI-Diktier-Apps haben in relativ kurzer Zeit bemerkenswerte Fortschritte gemacht. Lange Zeit waren sie träge und fehleranfällig, sodass die Nutzer mit einem bestimmten Akzent und vollkommen deutlich s
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

DeepL, ein Übersetzungsunternehmen, das vor allem für seine textbasierten Tools bekannt ist, hat heute eine Suite für Sprach-zu-Sprach-Übersetzungen auf den Markt gebracht, die über maßgeschneiderte Anwendungen Szenarien wie Besprechungen, Gespräche über Mobilgeräte und das Internet sowie Gruppendiskussionen für Mitarbeiter mit Kundenkontakt abdeckt. Das Unternehmen stellte zudem eine API vor, die es externen Entwicklern und Unternehmen ermöglicht, auf der DeepL-Technologie für maßgeschneiderte Anwendungsfälle wie Callcenter aufzubauen.
„Nachdem wir uns so viele Jahre auf die Textübersetzung konzentriert hatten, war die Sprachübersetzung für uns ein logischer nächster Schritt“, erklärte DeepL-CEO Jarek Kutylowski in einem Interview mit TechCrunch. „Wir haben bei der Übersetzung von Texten und Dokumenten erhebliche Fortschritte erzielt. Aber wir hatten das Gefühl, dass es kein wirklich gutes Produkt für die Echtzeit-Sprachübersetzung gab.“
Kutylowski erklärte, dass die größte Herausforderung bei der Entwicklung eines Echtzeit-Übersetzungsprodukts darin bestehe, das richtige Gleichgewicht zwischen der Reduzierung der Latenz – der Verzögerung zwischen dem Sprechen und dem Hören des übersetzten Audios – und der Aufrechterhaltung einer hohen Genauigkeit zu finden.
DeepL veröffentlicht Add-ons für Plattformen wie Zoom und Microsoft Teams, bei denen Zuhörer entweder Echtzeitübersetzungen hören können, während andere in ihrer Muttersprache sprechen, oder den in Echtzeit übersetzten Text auf dem Bildschirm verfolgen können. Dieses Programm ist derzeit im Early Access verfügbar, und das Unternehmen lädt Organisationen ein, sich auf eine Warteliste setzen zu lassen. DeepL bietet außerdem ein Produkt für mobile und webbasierte Gespräche an, unabhängig davon, ob diese persönlich oder aus der Ferne stattfinden.
DeepL ermöglicht es Nutzern zudem, an Gruppengesprächen in Umgebungen wie Schulungen oder Workshops teilzunehmen, wobei die Teilnehmer über einen QR-Code beitreten können.
DeepL gibt an, dass seine Voice-to-Voice-Technologie benutzerdefiniertes Vokabular lernen und sich daran anpassen kann, einschließlich branchenspezifischer Begriffe sowie Firmen- und Personennamen.
Kutylowski merkte an, dass KI den Kundenservice in den kommenden Jahren neu gestalten werde. Er wies darauf hin, dass eine Übersetzungsebene Unternehmen dabei helfe, Support in Sprachen anzubieten, in denen qualifiziertes Personal rar und teuer in der Einstellung sei.
Das Unternehmen gibt an, den gesamten Voice-to-Voice-Stack zu kontrollieren. Das aktuelle System wandelt jedoch Sprache in Text um, wendet die Übersetzung an und wandelt den Text anschließend wieder in Sprache um. DeepL ist überzeugt, dass seine jahrelange Arbeit im Bereich der Textübersetzung ihm einen Vorteil bei der Übersetzungsqualität verschafft. Mit Blick auf die Zukunft strebt das Unternehmen die Entwicklung eines durchgängigen Sprachübersetzungsmodells an, das den Text-Schritt vollständig umgeht.
DeepL steht im Wettbewerb mit mehreren gut finanzierten Start-ups, die in verwandten Bereichen tätig sind. Sanas, das im vergangenen Jahr 65 Millionen US-Dollar von Quadrille Capital und Teleperformance eingesammelt hat, nutzt KI, um den Akzent eines Sprechers in Echtzeit zu verändern – ein Tool, das in erster Linie auf Callcenter-Mitarbeiter abzielt.
Das in Dubai ansässige Unternehmen Camb.AI konzentriert sich auf Sprachsynthese und -übersetzung für Medien- und Unterhaltungsunternehmen, darunter Amazon Web Services, und unterstützt diese dabei, Videoinhalte in großem Umfang zu synchronisieren und zu lokalisieren.
Palabra, unterstützt von der Firma Seven Seven Six des Reddit-Mitbegründers Alexis Ohanian, entwickelt eine Echtzeit-Sprachübersetzungs-Engine, die sowohl die Bedeutung als auch die ursprüngliche Stimme des Sprechers bewahren soll, wodurch es in direkteren Wettbewerb zu dem tritt, was DeepL derzeit entwickelt.
ElevenLabs gibt BlackRock, Jamie Foxx und Eva Longoria als neue Investoren bekannt
Das Sprach-KI-Unternehmen ElevenLabs hat weitere Investoren für seine im Februar angekündigte Serie-D-Finanzierungsrunde in Höhe von 500 Millionen US-Dollar bekannt gegeben. Dazu gehören institutionel
Mistral stellt ein Open-Source-Modell zur Sprachgenerierung vor
Das französische KI-Unternehmen Mistral hat am Donnerstag ein neues Open-Source-Text-to-Speech-Modell vorgestellt, das für Sprach-KI-Assistenten und Unternehmensanwendungen wie den Kundensupport konzi
Die besten KI-Diktat-Apps: Expertenbewertungen und Rankings
KI-Diktier-Apps haben in relativ kurzer Zeit bemerkenswerte Fortschritte gemacht. Lange Zeit waren sie träge und fehleranfällig, sodass die Nutzer mit einem bestimmten Akzent und vollkommen deutlich s





Heim






