以文本翻译著称的DeepL,如今将目光投向了语音翻译

以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。
“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受TechCrunch采访时表示。“我们在文本和文档翻译方面取得了重大进展。但我们认为,目前市场上还没有一款优秀的实时语音翻译产品。”
库蒂洛夫斯基解释称,开发实时翻译产品的主要挑战在于,如何在降低延迟(即说话者发声与听到翻译语音之间的时差)与保持高准确度之间找到恰当的平衡。
DeepL 正在为 Zoom 和 Microsoft Teams 等平台推出插件,用户既可以在他人用母语讲话时听到实时翻译,也可以在屏幕上查看实时翻译文本。该程序目前处于早期访问阶段,公司正邀请各组织加入候补名单。 DeepL 还提供适用于移动端和网页端对话的产品,无论面对面还是远程交流均可使用。
此外,DeepL还支持用户在培训课程或研讨会等场景中参与群组对话,与会者可通过扫描二维码加入。
DeepL表示,其语音对语音技术能够学习并适应自定义词汇,包括行业术语以及公司和个人名称。
Kutylowski 指出,未来几年人工智能将重塑客户服务。他强调,翻译层有助于企业在合格员工稀缺且招聘成本高昂的语言领域提供支持。
该公司表示,其掌控着整个语音到语音的完整技术栈。不过,当前系统仍需先将语音转换为文本,进行翻译,再将文本转换回语音。DeepL认为,其在文本翻译领域多年的积累使其在翻译质量上具备优势。 展望未来,该公司计划开发一种完全跳过文本转换步骤的端到端语音翻译模型。
DeepL面临来自数家资金雄厚、从事相关领域初创企业的竞争。Sanas去年从Quadrille Capital和Teleperformance处筹集了6500万美元,该公司利用AI实时调整说话者的口音——这一工具主要面向呼叫中心客服人员。
总部位于迪拜的 Camb.AI 专注于为媒体和娱乐公司(包括亚马逊网络服务)提供语音合成与翻译服务,帮助它们大规模地为视频内容配音和本地化。
由Reddit联合创始人Alexis Ohanian旗下风投公司Seven Seven Six支持的Palabra,正在构建一款实时语音翻译引擎,旨在同时保留语义和说话者的原声,这使其与DeepL当前正在开发的产品形成了更直接的竞争关系。
相关文章
ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者
语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单,该轮融资最初于2月宣布。 其中包括贝莱德(BlackRock)、威灵顿(Wellington)、D.E. Shaw和施罗德(Schroders)等机构投资者;英伟达(NVIDIA)、Salesforce、桑坦德银行(Santander)、KPN和德国电信(Deutsche Telekom)等企业;以及杰米·福克斯(Jam
Mistral 发布开源语音生成模型
法国人工智能公司Mistral于周四发布了一款新的开源文本转语音模型,该模型专为语音AI助手及客户支持等企业应用而设计。该模型使企业能够构建用于销售和客户互动的语音代理,从而使Mistral成为ElevenLabs、Deepgram和OpenAI的直接竞争对手。该模型名为Voxtral TTS,支持九种语言,包括英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语。“我们的客户
最佳AI语音输入应用:专家评测与排行榜
AI语音输入应用在相对较短的时间内取得了显著进步。长期以来,这类应用反应迟缓且容易出错,要求用户必须使用特定的口音并清晰地表达。随着大型语言模型(LLMs)和语音转文本技术的进步,这一状况已然改变。如今的系统不仅能更准确地识别语音,还能利用上下文正确排版文本。开发者已集成自动去除口头语、修正语无伦次以及管理标点符号等功能,生成的文本几乎无需编辑。鉴于目前可选方案众多,我们整理了一份当前最佳且最实用
相关专题推荐
评论 (0)
0/500

以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。
“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受TechCrunch采访时表示。“我们在文本和文档翻译方面取得了重大进展。但我们认为,目前市场上还没有一款优秀的实时语音翻译产品。”
库蒂洛夫斯基解释称,开发实时翻译产品的主要挑战在于,如何在降低延迟(即说话者发声与听到翻译语音之间的时差)与保持高准确度之间找到恰当的平衡。
DeepL 正在为 Zoom 和 Microsoft Teams 等平台推出插件,用户既可以在他人用母语讲话时听到实时翻译,也可以在屏幕上查看实时翻译文本。该程序目前处于早期访问阶段,公司正邀请各组织加入候补名单。 DeepL 还提供适用于移动端和网页端对话的产品,无论面对面还是远程交流均可使用。
此外,DeepL还支持用户在培训课程或研讨会等场景中参与群组对话,与会者可通过扫描二维码加入。
DeepL表示,其语音对语音技术能够学习并适应自定义词汇,包括行业术语以及公司和个人名称。
Kutylowski 指出,未来几年人工智能将重塑客户服务。他强调,翻译层有助于企业在合格员工稀缺且招聘成本高昂的语言领域提供支持。
该公司表示,其掌控着整个语音到语音的完整技术栈。不过,当前系统仍需先将语音转换为文本,进行翻译,再将文本转换回语音。DeepL认为,其在文本翻译领域多年的积累使其在翻译质量上具备优势。 展望未来,该公司计划开发一种完全跳过文本转换步骤的端到端语音翻译模型。
DeepL面临来自数家资金雄厚、从事相关领域初创企业的竞争。Sanas去年从Quadrille Capital和Teleperformance处筹集了6500万美元,该公司利用AI实时调整说话者的口音——这一工具主要面向呼叫中心客服人员。
总部位于迪拜的 Camb.AI 专注于为媒体和娱乐公司(包括亚马逊网络服务)提供语音合成与翻译服务,帮助它们大规模地为视频内容配音和本地化。
由Reddit联合创始人Alexis Ohanian旗下风投公司Seven Seven Six支持的Palabra,正在构建一款实时语音翻译引擎,旨在同时保留语义和说话者的原声,这使其与DeepL当前正在开发的产品形成了更直接的竞争关系。
ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者
语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单,该轮融资最初于2月宣布。 其中包括贝莱德(BlackRock)、威灵顿(Wellington)、D.E. Shaw和施罗德(Schroders)等机构投资者;英伟达(NVIDIA)、Salesforce、桑坦德银行(Santander)、KPN和德国电信(Deutsche Telekom)等企业;以及杰米·福克斯(Jam
Mistral 发布开源语音生成模型
法国人工智能公司Mistral于周四发布了一款新的开源文本转语音模型,该模型专为语音AI助手及客户支持等企业应用而设计。该模型使企业能够构建用于销售和客户互动的语音代理,从而使Mistral成为ElevenLabs、Deepgram和OpenAI的直接竞争对手。该模型名为Voxtral TTS,支持九种语言,包括英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语。“我们的客户
最佳AI语音输入应用:专家评测与排行榜
AI语音输入应用在相对较短的时间内取得了显著进步。长期以来,这类应用反应迟缓且容易出错,要求用户必须使用特定的口音并清晰地表达。随着大型语言模型(LLMs)和语音转文本技术的进步,这一状况已然改变。如今的系统不仅能更准确地识别语音,还能利用上下文正确排版文本。开发者已集成自动去除口头语、修正语无伦次以及管理标点符号等功能,生成的文本几乎无需编辑。鉴于目前可选方案众多,我们整理了一份当前最佳且最实用





首页






