Google Cloud 增強 AI 媒體工具,新增音樂與視頻功能

週三,Google 發佈了其 Vertex AI 雲平台的升級,增強了多個專有媒體生成 AI 模型。
Lyria,Google 的文本轉音樂 AI,現已對部分用戶開放預覽,而 Veo 2 視頻模型則新增了進階編輯和視覺效果選項。此外,Google 推出了由其音頻處理模型 Chirp 3 驅動的語音克隆功能,供經批准的用戶使用。據 Google 表示,Imagen 3 圖像生成器的性能現已顯著提升。
這些更新在 Cloud Next 活動中宣佈,增強了 Google 在企業生成式 AI 市場的領先地位,與 Amazon 的 Bedrock 平台展開激烈競爭,後者提供相似的 AI 工具。
Google 將 Lyria 推廣為免版稅音樂庫的替代品,使用戶能夠生成從爵士鋼琴獨奏到 lo-fi 節拍等多樣風格的歌曲。
Chirp 3 支援約 35 種語言的語音合成。今年早些時候首次預覽,它驅動了即時自訂語音功能,僅需 10 秒音頻即可複製語音,現已廣泛可用。Chirp 3 還支援新的預覽工具「語音分割轉錄」,可在多人錄音中區分並標記不同講者。
為防止濫用,Google 表示,即時自訂語音功能需經過驗證流程,以確保語音使用許可的合法性。
Veo 2 現允許用戶移除視頻中的背景、標誌或物體,並延伸視頻畫面,例如將橫向畫面轉換為縱向。它還支援調整 AI 生成場景的攝影機角度和節奏,創造出如延時攝影或無人機風格的拍攝效果,並能在指定的起始和結束畫面之間進行插值。
這些 Veo 2 功能目前處於預覽階段。
Google 指出,Imagen 3 的增強功能提升了其移除物體及修復圖像缺失或損壞區域的能力。
所有由 Imagen、Veo 和 Lyria(但不包括 Chirp)生成的媒體均帶有 Google 的 SynthID 水印。Google 強調,其生成式 AI 模型包含防護措施,以防止創建有害內容。
Google 未透露其模型的訓練數據,這是一個因知識產權問題而經常引發爭議的話題。一些公司未經許可使用受版權保護的材料進行 AI 訓練,聲稱受美國公平使用保護,但創作者常在法庭上對此提出質疑。
Google 此前曾向 TechCrunch 表示,它提供模型訓練的退出選項,以及一項保障政策,以保護 Google Cloud 和 Vertex AI 用戶免受與 AI 相關的版權索賠。
相關文章
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
YouTube 測試由人工智慧驅動的搜尋功能,提供引導式答案
許多用戶在搜尋食譜或旅遊計畫時,都會轉向 YouTube 尋找相關影片。如今,該平台推出了一款由人工智慧驅動的互動式搜尋工具,能提供結合文字與影片內容的逐步指引結果。透過全新的「Ask YouTube」功能,使用者可以提出諸如「規劃從舊金山到聖塔芭芭拉的 3 天自駕遊」這類問題,並獲得結合文字、短片片段及較長影片的逐步指引結果——而非僅顯示影片結果。YouTube 表示,系統將同時顯示影片、相關片
相關專題推薦
評論 (6)
0/500
Ces outils de génération musicale et vidéo par IA sont fascinants, mais je m'inquiète un peu de l'impact potentiel sur les artistes... Les capacités de Lyria semblent impressionnantes, j'espère qu'il ne s'agira pas juste d'une autre technologie réservée à une élite. 🎵
Wow, Google's Vertex AI upgrades sound wild! Text-to-music with Lyria? I’m curious if it can whip up a catchy tune for my next TikTok. But, man, I hope they’re careful with copyright issues on this stuff. 😎
Wow, Google's Vertex AI upgrades sound like a game-changer for creators! Text-to-music with Lyria? That's like giving my playlists a sci-fi twist. Can't wait to see how this shakes up the content game! 🎶
Lyria sounds like a game-changer for music creation! 🎵 I’m curious if it can nail niche genres like lo-fi jazz. Google’s pushing hard against Amazon’s Bedrock, but I wonder how user-friendly this is for non-techies.
Google's new AI music and video tools sound like a game-changer! I'm stoked to see how Lyria creates tunes from just text prompts. Wonder if it can nail my favorite lo-fi vibes? 😎

週三,Google 發佈了其 Vertex AI 雲平台的升級,增強了多個專有媒體生成 AI 模型。
Lyria,Google 的文本轉音樂 AI,現已對部分用戶開放預覽,而 Veo 2 視頻模型則新增了進階編輯和視覺效果選項。此外,Google 推出了由其音頻處理模型 Chirp 3 驅動的語音克隆功能,供經批准的用戶使用。據 Google 表示,Imagen 3 圖像生成器的性能現已顯著提升。
這些更新在 Cloud Next 活動中宣佈,增強了 Google 在企業生成式 AI 市場的領先地位,與 Amazon 的 Bedrock 平台展開激烈競爭,後者提供相似的 AI 工具。
Google 將 Lyria 推廣為免版稅音樂庫的替代品,使用戶能夠生成從爵士鋼琴獨奏到 lo-fi 節拍等多樣風格的歌曲。
Chirp 3 支援約 35 種語言的語音合成。今年早些時候首次預覽,它驅動了即時自訂語音功能,僅需 10 秒音頻即可複製語音,現已廣泛可用。Chirp 3 還支援新的預覽工具「語音分割轉錄」,可在多人錄音中區分並標記不同講者。
為防止濫用,Google 表示,即時自訂語音功能需經過驗證流程,以確保語音使用許可的合法性。
Veo 2 現允許用戶移除視頻中的背景、標誌或物體,並延伸視頻畫面,例如將橫向畫面轉換為縱向。它還支援調整 AI 生成場景的攝影機角度和節奏,創造出如延時攝影或無人機風格的拍攝效果,並能在指定的起始和結束畫面之間進行插值。
這些 Veo 2 功能目前處於預覽階段。
Google 指出,Imagen 3 的增強功能提升了其移除物體及修復圖像缺失或損壞區域的能力。
所有由 Imagen、Veo 和 Lyria(但不包括 Chirp)生成的媒體均帶有 Google 的 SynthID 水印。Google 強調,其生成式 AI 模型包含防護措施,以防止創建有害內容。
Google 未透露其模型的訓練數據,這是一個因知識產權問題而經常引發爭議的話題。一些公司未經許可使用受版權保護的材料進行 AI 訓練,聲稱受美國公平使用保護,但創作者常在法庭上對此提出質疑。
Google 此前曾向 TechCrunch 表示,它提供模型訓練的退出選項,以及一項保障政策,以保護 Google Cloud 和 Vertex AI 用戶免受與 AI 相關的版權索賠。
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
YouTube 測試由人工智慧驅動的搜尋功能,提供引導式答案
許多用戶在搜尋食譜或旅遊計畫時,都會轉向 YouTube 尋找相關影片。如今,該平台推出了一款由人工智慧驅動的互動式搜尋工具,能提供結合文字與影片內容的逐步指引結果。透過全新的「Ask YouTube」功能,使用者可以提出諸如「規劃從舊金山到聖塔芭芭拉的 3 天自駕遊」這類問題,並獲得結合文字、短片片段及較長影片的逐步指引結果——而非僅顯示影片結果。YouTube 表示,系統將同時顯示影片、相關片
Ces outils de génération musicale et vidéo par IA sont fascinants, mais je m'inquiète un peu de l'impact potentiel sur les artistes... Les capacités de Lyria semblent impressionnantes, j'espère qu'il ne s'agira pas juste d'une autre technologie réservée à une élite. 🎵
Wow, Google's Vertex AI upgrades sound wild! Text-to-music with Lyria? I’m curious if it can whip up a catchy tune for my next TikTok. But, man, I hope they’re careful with copyright issues on this stuff. 😎
Wow, Google's Vertex AI upgrades sound like a game-changer for creators! Text-to-music with Lyria? That's like giving my playlists a sci-fi twist. Can't wait to see how this shakes up the content game! 🎶
Lyria sounds like a game-changer for music creation! 🎵 I’m curious if it can nail niche genres like lo-fi jazz. Google’s pushing hard against Amazon’s Bedrock, but I wonder how user-friendly this is for non-techies.
Google's new AI music and video tools sound like a game-changer! I'm stoked to see how Lyria creates tunes from just text prompts. Wonder if it can nail my favorite lo-fi vibes? 😎





首頁






