Fish Audio 推出 S2:开源模型实现词级情感控制

Fish Audio 已正式推出其全新的文本转语音模型 S2,这标志着开源 TTS 技术在表现力和可控性方面取得了重大飞跃。
这款名为 Fish Audio S2 的模型重点强化了情感控制能力。用户可通过自然语言指令对语调和情感进行精细调整。无论是插入 [laugh]、[whisper] 或 [super happy] 等标签,还是使用 [专业播音语气] 或 [提高音调] 等自由描述,该模型都能实现精准的单词级控制,从而生成极具表现力且自然生动的语音。
主要特点包括:
完全开源:模型权重、微调代码以及基于 SGLang 的流式推理引擎均已在 GitHub 和 Hugging Face 上公开发布。 S2-Pro 是旗舰版本,拥有约 44 亿个参数。超低延迟:推理延迟低于 150 毫秒,非常适合聊天机器人和虚拟主播等实时应用。原生多说话人支持:它可以在单次推理中处理多个说话人,处理对话轮次、插话和自然的情感表达,同时保持一致的语音质量,无需额外处理。Fish Audio 表示,S2 基于涵盖近 50 种语言的约 1000 万小时音频数据进行训练。通过利用强化学习对齐和双自回归架构,它在多个基准测试中展现出领先的自然度和表现力。它被认为是目前最富情感智能的 TTS 系统之一,无论开源还是专有。"真正的语言自由从现在开始,"Fish Audio 宣布,标志着具有真实情感和个性的 AI 语音时代的到来。
GitHub:https://github.com/fishaudio/fish-speech/
HuggingFace:https://huggingface.co/fishaudio/s2-pro/
相关文章
海尔推出全球最轻的人工智能运动外骨骼机器人,重量仅为1.75公斤
海尔集团推出了全球最轻的运动型人工智能外骨骼机器人——海尔外骨骼机器人W3。此次发布创下了行业轻量化新纪录,标志着在轻量化设计和智能人体运动增强领域取得了重大突破。高端材料成就超轻量化设计W3采用创新的一体化制造工艺,融合全碳纤维与钛合金。这种航空级材料组合将总重量控制在仅1.75公斤,实现了轻量化与高强度的完美平衡,展现出极致的机械性能。为提升舒适度,该机器人融入了非牛顿流体材料,触感柔软亲肤,
耀科传媒首部AIGC剧集《秦岭青铜之谜》今日上线,主演均由AI生成
今日,耀科传媒的AIGC奇幻悬疑短剧《秦岭青铜秘闻》正式上线。该剧由公司签约的首批两位AI演员秦凌月和林西妍主演,故事背景设定在神秘的秦岭矿区。 剧中,退役情报官秦月率队深入该区域,揭开了一起尘封已久的矿难真相,以及跨越两代人的血祭之谜——这个真相就隐藏在受限的地下区域,那里是科学探索与古代巫术交汇之地。作为中国最早完全由AI数字人支撑的影视作品之一,该剧在筹备阶段便引发了业界热烈讨论,而关于其A
萨提亚·纳德拉准备利用与OpenAI的新合作关系
周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
相关专题推荐
评论 (0)
0/500

Fish Audio 已正式推出其全新的文本转语音模型 S2,这标志着开源 TTS 技术在表现力和可控性方面取得了重大飞跃。
这款名为 Fish Audio S2 的模型重点强化了情感控制能力。用户可通过自然语言指令对语调和情感进行精细调整。无论是插入 [laugh]、[whisper] 或 [super happy] 等标签,还是使用 [专业播音语气] 或 [提高音调] 等自由描述,该模型都能实现精准的单词级控制,从而生成极具表现力且自然生动的语音。
主要特点包括:
完全开源:模型权重、微调代码以及基于 SGLang 的流式推理引擎均已在 GitHub 和 Hugging Face 上公开发布。 S2-Pro 是旗舰版本,拥有约 44 亿个参数。超低延迟:推理延迟低于 150 毫秒,非常适合聊天机器人和虚拟主播等实时应用。原生多说话人支持:它可以在单次推理中处理多个说话人,处理对话轮次、插话和自然的情感表达,同时保持一致的语音质量,无需额外处理。Fish Audio 表示,S2 基于涵盖近 50 种语言的约 1000 万小时音频数据进行训练。通过利用强化学习对齐和双自回归架构,它在多个基准测试中展现出领先的自然度和表现力。它被认为是目前最富情感智能的 TTS 系统之一,无论开源还是专有。"真正的语言自由从现在开始,"Fish Audio 宣布,标志着具有真实情感和个性的 AI 语音时代的到来。
GitHub:https://github.com/fishaudio/fish-speech/
HuggingFace:https://huggingface.co/fishaudio/s2-pro/
海尔推出全球最轻的人工智能运动外骨骼机器人,重量仅为1.75公斤
海尔集团推出了全球最轻的运动型人工智能外骨骼机器人——海尔外骨骼机器人W3。此次发布创下了行业轻量化新纪录,标志着在轻量化设计和智能人体运动增强领域取得了重大突破。高端材料成就超轻量化设计W3采用创新的一体化制造工艺,融合全碳纤维与钛合金。这种航空级材料组合将总重量控制在仅1.75公斤,实现了轻量化与高强度的完美平衡,展现出极致的机械性能。为提升舒适度,该机器人融入了非牛顿流体材料,触感柔软亲肤,
耀科传媒首部AIGC剧集《秦岭青铜之谜》今日上线,主演均由AI生成
今日,耀科传媒的AIGC奇幻悬疑短剧《秦岭青铜秘闻》正式上线。该剧由公司签约的首批两位AI演员秦凌月和林西妍主演,故事背景设定在神秘的秦岭矿区。 剧中,退役情报官秦月率队深入该区域,揭开了一起尘封已久的矿难真相,以及跨越两代人的血祭之谜——这个真相就隐藏在受限的地下区域,那里是科学探索与古代巫术交汇之地。作为中国最早完全由AI数字人支撑的影视作品之一,该剧在筹备阶段便引发了业界热烈讨论,而关于其A
萨提亚·纳德拉准备利用与OpenAI的新合作关系
周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“





首页






