Google将Chirp 3语音模型集成到顶点AI

生成式AI主要围绕基于文本的界面,用于创建文本、图像等内容。但现在,语音技术正成为焦点,且势头强劲。Google刚刚发布了一则重磅消息:从下周开始,他们将在Vertex AI平台上推出Chirp 3——其最新的语音转文本和高清文本转语音模型。
就在上周,Google悄无声息地宣布,Chirp 3将引入覆盖31种语言的八种新语音。这一技术非常适合构建语音助手、制作有声读物,甚至创建支持代理和视频配音。他们在伦敦Google DeepMind办公室的一场活动中分享了这一消息。
Google并不是唯一加入语音AI热潮的公司。上周,Sesame——以超现实AI语音“Maya”和“Miles”闻名的公司——宣布他们将允许开发者使用其技术构建自定义应用程序和服务。
Google试图通过对Chirp 3设置一些使用限制来防止滥用。Google Cloud首席执行官Thomas Kurian在今天的新闻活动中表示:“我们正与我们的安全团队一起处理这些问题。”
ElevenLabs是AI语音领域的另一大玩家,已筹集数百万资金以扩展其语音服务。
通过Chirp 3,Google将其与最新版本的LLM Gemini(仍在测试中)、图像生成模型Imagen以及昂贵的Veo 2视频生成工具归入同一家族。
Chirp 3的声音是否能像其他一些AI语音(Sesame的成果相当令人印象深刻)那样“真实”尚不确定。但正如DeepMind首席执行官Demis Hassabis所指出的,这是一场马拉松,而非短跑。
“在短期内……这种认为[AI]在未来几年是万能灵药的想法,我认为目前还不会实现。我认为我们距离AGI的实现还有好几年,”他说。“它将在未来十年内改变事物……属于中长期。这是一个有趣的时刻。”
Google于2021年推出Vertex AI,作为开发者在云端构建机器学习服务的平台。那时AI,尤其是生成式AI,还远未成为如今因OpenAI的GPT服务而引发的热门话题。
自那以后,Google一直在大力推动Vertex AI,努力跟上Microsoft和Amazon的步伐,这两家公司也在为开发者构建生成式AI工具。通过Vertex AI,开发者不仅可以基于Gemini构建,还可以分类数据、训练模型并准备投入生产。Google是否会开放其平台以支持其他创作者的模型,将是一个值得关注的问题。
Google多年来一直在研发“Chirp”语音技术,早在将其作为代号挑战Amazon的Alexa时就已经开始。
相关文章
谷歌最新的双子座人工智能模型在测试中显示安全得分下降
谷歌的内部测试显示,与以前的版本相比,其最新人工智能模型的安全协议性能下降令人担忧。根据最新公布的基准,在处理文本和图像提示时,Gemini 2.5 Flash 模型在关键安全指标上的准则违反率比以往高出 4-10%。这家科技巨头的自动评估结果凸显了令人担忧的趋势:当出现边界测试提示时,Gemini 2.5 Flash 比其前身 Gemini 2.0 更频繁地跨越既定的内容安全线。谷歌的技术团队将
谷歌的 Stitch AI 简化了应用程序设计流程
谷歌在 I/O 2025 大会上发布人工智能设计工具 Stitch在 2025 年谷歌 I/O 大会的主题演讲中,谷歌推出了革命性的人工智能界面设计工具 Stitch。这一创新解决方案可将自然语言提示或参考图片转化为功能齐全的用户界面设计,并提供可直接投入生产的 HTML 和 CSS 代码。Stitch的双模型架构可在Gemini 2.5 Pro和Flash模型之间灵活切换,以满足不同的设计需求图
谷歌为 Gmail、文档和视频推出人工智能工具
谷歌在 2025 年 I/O 大会上发布人工智能驱动的工作空间更新在年度开发者大会上,谷歌推出了工作空间套件的变革性人工智能增强功能,从根本上改变了用户与 Gmail、Docs 和视频的交互方式。更新的重点是智能自动化和简化生产力应用中的工作流程。图片来源:Google谷歌Gmail 的智能生产力功能电子邮件服务将获得两项突破性的功能:智能回复(Context-Aware Smart Replie
评论 (65)
0/200
RichardThomas
2025-09-22 08:30:31
Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!
0
JackHernández
2025-08-09 15:00:59
Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎
0
CharlesWhite
2025-08-04 14:48:52
Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️
0
RogerMartinez
2025-08-01 21:47:34
Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?
0
DennisMitchell
2025-07-28 09:20:02
Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎
0
JoeGarcía
2025-04-21 10:59:24
谷歌在Vertex AI中整合Chirp 3真是太酷了!语音技术终于得到了应有的关注。迫不及待想下周试试看。但希望他们能更多地专注于提高准确性。现在还不是完美的!🤫
0
生成式AI主要围绕基于文本的界面,用于创建文本、图像等内容。但现在,语音技术正成为焦点,且势头强劲。Google刚刚发布了一则重磅消息:从下周开始,他们将在Vertex AI平台上推出Chirp 3——其最新的语音转文本和高清文本转语音模型。
就在上周,Google悄无声息地宣布,Chirp 3将引入覆盖31种语言的八种新语音。这一技术非常适合构建语音助手、制作有声读物,甚至创建支持代理和视频配音。他们在伦敦Google DeepMind办公室的一场活动中分享了这一消息。
Google并不是唯一加入语音AI热潮的公司。上周,Sesame——以超现实AI语音“Maya”和“Miles”闻名的公司——宣布他们将允许开发者使用其技术构建自定义应用程序和服务。
Google试图通过对Chirp 3设置一些使用限制来防止滥用。Google Cloud首席执行官Thomas Kurian在今天的新闻活动中表示:“我们正与我们的安全团队一起处理这些问题。”
ElevenLabs是AI语音领域的另一大玩家,已筹集数百万资金以扩展其语音服务。
通过Chirp 3,Google将其与最新版本的LLM Gemini(仍在测试中)、图像生成模型Imagen以及昂贵的Veo 2视频生成工具归入同一家族。
Chirp 3的声音是否能像其他一些AI语音(Sesame的成果相当令人印象深刻)那样“真实”尚不确定。但正如DeepMind首席执行官Demis Hassabis所指出的,这是一场马拉松,而非短跑。
“在短期内……这种认为[AI]在未来几年是万能灵药的想法,我认为目前还不会实现。我认为我们距离AGI的实现还有好几年,”他说。“它将在未来十年内改变事物……属于中长期。这是一个有趣的时刻。”
Google于2021年推出Vertex AI,作为开发者在云端构建机器学习服务的平台。那时AI,尤其是生成式AI,还远未成为如今因OpenAI的GPT服务而引发的热门话题。
自那以后,Google一直在大力推动Vertex AI,努力跟上Microsoft和Amazon的步伐,这两家公司也在为开发者构建生成式AI工具。通过Vertex AI,开发者不仅可以基于Gemini构建,还可以分类数据、训练模型并准备投入生产。Google是否会开放其平台以支持其他创作者的模型,将是一个值得关注的问题。
Google多年来一直在研发“Chirp”语音技术,早在将其作为代号挑战Amazon的Alexa时就已经开始。



Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!




Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎




Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️




Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?




Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎




谷歌在Vertex AI中整合Chirp 3真是太酷了!语音技术终于得到了应有的关注。迫不及待想下周试试看。但希望他们能更多地专注于提高准确性。现在还不是完美的!🤫












