Google将Chirp 3语音模型集成到顶点AI

生成式AI主要围绕基于文本的界面,用于创建文本、图像等内容。但现在,语音技术正成为焦点,且势头强劲。Google刚刚发布了一则重磅消息:从下周开始,他们将在Vertex AI平台上推出Chirp 3——其最新的语音转文本和高清文本转语音模型。
就在上周,Google悄无声息地宣布,Chirp 3将引入覆盖31种语言的八种新语音。这一技术非常适合构建语音助手、制作有声读物,甚至创建支持代理和视频配音。他们在伦敦Google DeepMind办公室的一场活动中分享了这一消息。
Google并不是唯一加入语音AI热潮的公司。上周,Sesame——以超现实AI语音“Maya”和“Miles”闻名的公司——宣布他们将允许开发者使用其技术构建自定义应用程序和服务。
Google试图通过对Chirp 3设置一些使用限制来防止滥用。Google Cloud首席执行官Thomas Kurian在今天的新闻活动中表示:“我们正与我们的安全团队一起处理这些问题。”
ElevenLabs是AI语音领域的另一大玩家,已筹集数百万资金以扩展其语音服务。
通过Chirp 3,Google将其与最新版本的LLM Gemini(仍在测试中)、图像生成模型Imagen以及昂贵的Veo 2视频生成工具归入同一家族。
Chirp 3的声音是否能像其他一些AI语音(Sesame的成果相当令人印象深刻)那样“真实”尚不确定。但正如DeepMind首席执行官Demis Hassabis所指出的,这是一场马拉松,而非短跑。
“在短期内……这种认为[AI]在未来几年是万能灵药的想法,我认为目前还不会实现。我认为我们距离AGI的实现还有好几年,”他说。“它将在未来十年内改变事物……属于中长期。这是一个有趣的时刻。”
Google于2021年推出Vertex AI,作为开发者在云端构建机器学习服务的平台。那时AI,尤其是生成式AI,还远未成为如今因OpenAI的GPT服务而引发的热门话题。
自那以后,Google一直在大力推动Vertex AI,努力跟上Microsoft和Amazon的步伐,这两家公司也在为开发者构建生成式AI工具。通过Vertex AI,开发者不仅可以基于Gemini构建,还可以分类数据、训练模型并准备投入生产。Google是否会开放其平台以支持其他创作者的模型,将是一个值得关注的问题。
Google多年来一直在研发“Chirp”语音技术,早在将其作为代号挑战Amazon的Alexa时就已经开始。
相关文章
Google I/O 2026 发布 Gmail 收件箱语音交互功能
谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
Mistral 发布开源语音生成模型
法国人工智能公司Mistral于周四发布了一款新的开源文本转语音模型,该模型专为语音AI助手及客户支持等企业应用而设计。该模型使企业能够构建用于销售和客户互动的语音代理,从而使Mistral成为ElevenLabs、Deepgram和OpenAI的直接竞争对手。该模型名为Voxtral TTS,支持九种语言,包括英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语。“我们的客户
相关专题推荐
评论 (65)
0/500
Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!
Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎
Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️
Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?
Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎

生成式AI主要围绕基于文本的界面,用于创建文本、图像等内容。但现在,语音技术正成为焦点,且势头强劲。Google刚刚发布了一则重磅消息:从下周开始,他们将在Vertex AI平台上推出Chirp 3——其最新的语音转文本和高清文本转语音模型。
就在上周,Google悄无声息地宣布,Chirp 3将引入覆盖31种语言的八种新语音。这一技术非常适合构建语音助手、制作有声读物,甚至创建支持代理和视频配音。他们在伦敦Google DeepMind办公室的一场活动中分享了这一消息。
Google并不是唯一加入语音AI热潮的公司。上周,Sesame——以超现实AI语音“Maya”和“Miles”闻名的公司——宣布他们将允许开发者使用其技术构建自定义应用程序和服务。
Google试图通过对Chirp 3设置一些使用限制来防止滥用。Google Cloud首席执行官Thomas Kurian在今天的新闻活动中表示:“我们正与我们的安全团队一起处理这些问题。”
ElevenLabs是AI语音领域的另一大玩家,已筹集数百万资金以扩展其语音服务。
通过Chirp 3,Google将其与最新版本的LLM Gemini(仍在测试中)、图像生成模型Imagen以及昂贵的Veo 2视频生成工具归入同一家族。
Chirp 3的声音是否能像其他一些AI语音(Sesame的成果相当令人印象深刻)那样“真实”尚不确定。但正如DeepMind首席执行官Demis Hassabis所指出的,这是一场马拉松,而非短跑。
“在短期内……这种认为[AI]在未来几年是万能灵药的想法,我认为目前还不会实现。我认为我们距离AGI的实现还有好几年,”他说。“它将在未来十年内改变事物……属于中长期。这是一个有趣的时刻。”
Google于2021年推出Vertex AI,作为开发者在云端构建机器学习服务的平台。那时AI,尤其是生成式AI,还远未成为如今因OpenAI的GPT服务而引发的热门话题。
自那以后,Google一直在大力推动Vertex AI,努力跟上Microsoft和Amazon的步伐,这两家公司也在为开发者构建生成式AI工具。通过Vertex AI,开发者不仅可以基于Gemini构建,还可以分类数据、训练模型并准备投入生产。Google是否会开放其平台以支持其他创作者的模型,将是一个值得关注的问题。
Google多年来一直在研发“Chirp”语音技术,早在将其作为代号挑战Amazon的Alexa时就已经开始。
Google I/O 2026 发布 Gmail 收件箱语音交互功能
谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
Mistral 发布开源语音生成模型
法国人工智能公司Mistral于周四发布了一款新的开源文本转语音模型,该模型专为语音AI助手及客户支持等企业应用而设计。该模型使企业能够构建用于销售和客户互动的语音代理,从而使Mistral成为ElevenLabs、Deepgram和OpenAI的直接竞争对手。该模型名为Voxtral TTS,支持九种语言,包括英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语。“我们的客户
Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!
Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎
Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️
Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?
Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎





首页






