OpenAI在其API中推出了语音智能功能

OpenAI在周四宣布,其API现已新增多项语音智能功能,这些功能旨在帮助开发者构建能够进行对话、转录和翻译的应用程序。
该公司新推出的GPT-Realtime-2是一款语音模型,它能够生成逼真的声音模拟效果,从而与用户进行交流。不过,与前代产品GPT-Realtime-1.5不同,这一版本融入了GPT-5级别的推理能力,OpenAI表示,这种能力使该模型能够处理更复杂的用户请求。
此外,OpenAI还推出了GPT-Realtime-Translate功能,顾名思义,它能够提供实时翻译服务,在用户对话过程中实时进行语言转换。这一功能支持超过70种输入语言和13种输出语言。
最后,OpenAI还引入了GPT-Realtime-Whisper这一转录工具,它可以实时将语音转换为文本,从而在对话进行的过程中捕捉文字内容。
该公司表示:“我们推出的这些模型共同将实时的音频技术从简单的问答模式提升到了真正能够完成实际任务的语音交互层面——它们可以倾听、推理、翻译、转录,并在对话过程中采取相应行动。”
那么,谁会从这些更新中受益呢?显然,那些希望提升客户服务能力的企业会是主要受益者。不过,OpenAI也指出,这些新功能还能应用于教育、媒体、活动以及创作者平台等多个领域。
虽然从企业的角度来看,这些工具非常有用,但它们也存在被滥用的风险。OpenAI表示,他们已经设置了相应的防护机制,以防止这些新功能被用于发送垃圾信息、进行欺诈或其他形式的网络滥用行为。系统中嵌入了特定的检测机制,一旦发现某些对话违反了他们的内容规范,就会立即停止相关操作。
所有这些新的语音模型都包含在OpenAI的Realtime API中。Translate和Whisper功能是按分钟计费的,而GPT-Realtime-2则根据所消耗的令牌数量来收费。
相关文章
萨提亚·纳德拉准备利用与OpenAI的新合作关系
周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图
正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI
2017年8月下旬,OpenAI(当时还是一家小型非营利研究实验室)的核心成员召开会议,商讨如何成立一家营利性实体,以实现技术的商业化,并筹集实现通用人工智能(AGI)所需的资金。埃隆·马斯克要求全面掌控公司,并刚刚向每位联合创始人赠送了一辆特斯拉Model 3。首席技术官格雷格·布罗克曼表示,他认为这是马斯克试图收买人心,当时马斯克和萨姆·阿尔特曼正就各自对公司未来愿景的支持展开角逐。 Open
相关专题推荐
评论 (0)
0/500

OpenAI在周四宣布,其API现已新增多项语音智能功能,这些功能旨在帮助开发者构建能够进行对话、转录和翻译的应用程序。
该公司新推出的GPT-Realtime-2是一款语音模型,它能够生成逼真的声音模拟效果,从而与用户进行交流。不过,与前代产品GPT-Realtime-1.5不同,这一版本融入了GPT-5级别的推理能力,OpenAI表示,这种能力使该模型能够处理更复杂的用户请求。
此外,OpenAI还推出了GPT-Realtime-Translate功能,顾名思义,它能够提供实时翻译服务,在用户对话过程中实时进行语言转换。这一功能支持超过70种输入语言和13种输出语言。
最后,OpenAI还引入了GPT-Realtime-Whisper这一转录工具,它可以实时将语音转换为文本,从而在对话进行的过程中捕捉文字内容。
该公司表示:“我们推出的这些模型共同将实时的音频技术从简单的问答模式提升到了真正能够完成实际任务的语音交互层面——它们可以倾听、推理、翻译、转录,并在对话过程中采取相应行动。”
那么,谁会从这些更新中受益呢?显然,那些希望提升客户服务能力的企业会是主要受益者。不过,OpenAI也指出,这些新功能还能应用于教育、媒体、活动以及创作者平台等多个领域。
虽然从企业的角度来看,这些工具非常有用,但它们也存在被滥用的风险。OpenAI表示,他们已经设置了相应的防护机制,以防止这些新功能被用于发送垃圾信息、进行欺诈或其他形式的网络滥用行为。系统中嵌入了特定的检测机制,一旦发现某些对话违反了他们的内容规范,就会立即停止相关操作。
所有这些新的语音模型都包含在OpenAI的Realtime API中。Translate和Whisper功能是按分钟计费的,而GPT-Realtime-2则根据所消耗的令牌数量来收费。
萨提亚·纳德拉准备利用与OpenAI的新合作关系
周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图
正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI
2017年8月下旬,OpenAI(当时还是一家小型非营利研究实验室)的核心成员召开会议,商讨如何成立一家营利性实体,以实现技术的商业化,并筹集实现通用人工智能(AGI)所需的资金。埃隆·马斯克要求全面掌控公司,并刚刚向每位联合创始人赠送了一辆特斯拉Model 3。首席技术官格雷格·布罗克曼表示,他认为这是马斯克试图收买人心,当时马斯克和萨姆·阿尔特曼正就各自对公司未来愿景的支持展开角逐。 Open





首页






