Google將Chirp 3語音模型集成到頂點AI

生成式AI主要涉及基於文字的介面,用於創建文字、圖像等內容。但現在,語音正成為焦點,且來勢洶洶。Google剛剛發布重大消息:從下週開始,他們將在Vertex AI平台上推出Chirp 3——他們最新的語音轉文字和高清文字轉語音模型。
就在上週,Google悄悄宣布Chirp 3將引入涵蓋31種語言的八種新語音。這項技術非常適合用於構建語音助手、製作有聲書,甚至創建支援代理和影片配音。他們在倫敦Google DeepMind辦公室的一場活動中分享了這一消息。
Google並非唯一投入語音AI潮流的公司。上週,打造超逼真AI語音“Maya”和“Miles”的Sesame宣布,他們將允許開發者使用其技術構建自訂應用程式和服務。
Google試圖通過對Chirp 3設置一些使用限制來防止濫用,以保持控制。Google Cloud執行長Thomas Kurian在今日的新聞活動中表示:“我們正與安全團隊一起處理這些問題。”
ElevenLabs是AI語音領域的另一大參與者,已籌集數百萬資金以擴展其語音服務。
透過Chirp 3,Google將其與最新版本的LLM Gemini(仍在測試中)、圖像生成模型Imagen以及價格昂貴的Veo 2影片生成工具納入同一家族。
Chirp 3的語音是否能像其他AI語音(Sesame的成果相當令人印象深刻)一樣“真實”仍有待觀察。但正如DeepMind執行長Demis Hassabis所指出的,這是一場馬拉松,而不是短跑。
“在短期內……認為[AI]是未來幾年內解決一切問題的靈丹妙藥,我認為這還不會發生。我認為我們距離AGI的實現還有好幾年,”他說。“它將改變事物……在未來十年內,因此是中長期的事。這是一個有趣的時刻。”
Google於2021年推出Vertex AI,作為開發者在雲端構建機器學習服務的平台。那時AI,尤其是生成式AI,還遠未成為如今因OpenAI的GPT服務而掀起的熱門話題。
自那時起,Google一直在大力推動Vertex AI,努力跟上Microsoft和Amazon等公司,後者也在為開發者打造生成式AI工具。透過Vertex AI,開發者不僅可以基於Gemini進行構建,還可以分類數據、訓練模型並準備投入生產。有趣的是,Google是否會決定向其他創作者的模型開放其平台。
Google多年來一直在研究“Chirp”語音技術,早在他們用其作為代號挑戰Amazon的Alexa時就已開始。
相關文章
以文字翻譯聞名的 DeepL,現已進軍語音翻譯領域
以文字翻譯工具聞名的翻譯公司 DeepL,今日推出了一套語音對語音翻譯解決方案,透過客製化應用程式,針對前線工作人員在會議、行動裝置與網路對話,以及群組討論等情境提供支援。 該公司同時推出了一項 API,讓外部開發者與企業能基於 DeepL 的技術,打造適用於呼叫中心等特定情境的解決方案。「在專注於文字翻譯多年後,語音翻譯對我們而言是水到渠成的下一步,」DeepL 執行長 Jarek Kutylo
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
相關專題推薦
評論 (65)
0/500
Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!
Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎
Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️
Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?
Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎

生成式AI主要涉及基於文字的介面,用於創建文字、圖像等內容。但現在,語音正成為焦點,且來勢洶洶。Google剛剛發布重大消息:從下週開始,他們將在Vertex AI平台上推出Chirp 3——他們最新的語音轉文字和高清文字轉語音模型。
就在上週,Google悄悄宣布Chirp 3將引入涵蓋31種語言的八種新語音。這項技術非常適合用於構建語音助手、製作有聲書,甚至創建支援代理和影片配音。他們在倫敦Google DeepMind辦公室的一場活動中分享了這一消息。
Google並非唯一投入語音AI潮流的公司。上週,打造超逼真AI語音“Maya”和“Miles”的Sesame宣布,他們將允許開發者使用其技術構建自訂應用程式和服務。
Google試圖通過對Chirp 3設置一些使用限制來防止濫用,以保持控制。Google Cloud執行長Thomas Kurian在今日的新聞活動中表示:“我們正與安全團隊一起處理這些問題。”
ElevenLabs是AI語音領域的另一大參與者,已籌集數百萬資金以擴展其語音服務。
透過Chirp 3,Google將其與最新版本的LLM Gemini(仍在測試中)、圖像生成模型Imagen以及價格昂貴的Veo 2影片生成工具納入同一家族。
Chirp 3的語音是否能像其他AI語音(Sesame的成果相當令人印象深刻)一樣“真實”仍有待觀察。但正如DeepMind執行長Demis Hassabis所指出的,這是一場馬拉松,而不是短跑。
“在短期內……認為[AI]是未來幾年內解決一切問題的靈丹妙藥,我認為這還不會發生。我認為我們距離AGI的實現還有好幾年,”他說。“它將改變事物……在未來十年內,因此是中長期的事。這是一個有趣的時刻。”
Google於2021年推出Vertex AI,作為開發者在雲端構建機器學習服務的平台。那時AI,尤其是生成式AI,還遠未成為如今因OpenAI的GPT服務而掀起的熱門話題。
自那時起,Google一直在大力推動Vertex AI,努力跟上Microsoft和Amazon等公司,後者也在為開發者打造生成式AI工具。透過Vertex AI,開發者不僅可以基於Gemini進行構建,還可以分類數據、訓練模型並準備投入生產。有趣的是,Google是否會決定向其他創作者的模型開放其平台。
Google多年來一直在研究“Chirp”語音技術,早在他們用其作為代號挑戰Amazon的Alexa時就已開始。
以文字翻譯聞名的 DeepL,現已進軍語音翻譯領域
以文字翻譯工具聞名的翻譯公司 DeepL,今日推出了一套語音對語音翻譯解決方案,透過客製化應用程式,針對前線工作人員在會議、行動裝置與網路對話,以及群組討論等情境提供支援。 該公司同時推出了一項 API,讓外部開發者與企業能基於 DeepL 的技術,打造適用於呼叫中心等特定情境的解決方案。「在專注於文字翻譯多年後,語音翻譯對我們而言是水到渠成的下一步,」DeepL 執行長 Jarek Kutylo
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
Finalmente uma atualização de voz descente no Vertex AI! 🎙️ Mas sinceramente... será que o Chirp 3 vai competir com a qualidade da Whisper da OpenAI? To cansado de assistir vídeos com legendas zoadas geradas por IA. Google, não me decepcione dessa vez!
Voice AI is getting wild! Google's Chirp 3 sounds like a game-changer for Vertex AI. Can't wait to see how devs use this for next-level apps! 😎
Whoa, Google’s Chirp 3 sounds like a game-changer for voice AI! I’m curious how it stacks up against other models—anyone tried it yet? 🗣️
Whoa, Google's Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other speech-to-text models. 😎 Anyone else excited to try this out on Vertex AI?
Whoa, Chirp 3 sounds like a game-changer for voice AI! Can't wait to see how it stacks up against other models. Google’s really pushing the envelope here! 😎





首頁






