選項
首頁
新聞
Google Cloud 增強 AI 媒體工具,新增音樂與視頻功能

Google Cloud 增強 AI 媒體工具,新增音樂與視頻功能

2025-07-31
0

Google Cloud 增強 AI 媒體工具,新增音樂與視頻功能

週三,Google 發佈了其 Vertex AI 雲平台的升級,增強了多個專有媒體生成 AI 模型。

Lyria,Google 的文本轉音樂 AI,現已對部分用戶開放預覽,而 Veo 2 視頻模型則新增了進階編輯和視覺效果選項。此外,Google 推出了由其音頻處理模型 Chirp 3 驅動的語音克隆功能,供經批准的用戶使用。據 Google 表示,Imagen 3 圖像生成器的性能現已顯著提升。

這些更新在 Cloud Next 活動中宣佈,增強了 Google 在企業生成式 AI 市場的領先地位,與 Amazon 的 Bedrock 平台展開激烈競爭,後者提供相似的 AI 工具。

Google 將 Lyria 推廣為免版稅音樂庫的替代品,使用戶能夠生成從爵士鋼琴獨奏到 lo-fi 節拍等多樣風格的歌曲。

Chirp 3 支援約 35 種語言的語音合成。今年早些時候首次預覽,它驅動了即時自訂語音功能,僅需 10 秒音頻即可複製語音,現已廣泛可用。Chirp 3 還支援新的預覽工具「語音分割轉錄」,可在多人錄音中區分並標記不同講者。

為防止濫用,Google 表示,即時自訂語音功能需經過驗證流程,以確保語音使用許可的合法性。

Veo 2 現允許用戶移除視頻中的背景、標誌或物體,並延伸視頻畫面,例如將橫向畫面轉換為縱向。它還支援調整 AI 生成場景的攝影機角度和節奏,創造出如延時攝影或無人機風格的拍攝效果,並能在指定的起始和結束畫面之間進行插值。

這些 Veo 2 功能目前處於預覽階段。

Google 指出,Imagen 3 的增強功能提升了其移除物體及修復圖像缺失或損壞區域的能力。

所有由 Imagen、Veo 和 Lyria(但不包括 Chirp)生成的媒體均帶有 Google 的 SynthID 水印。Google 強調,其生成式 AI 模型包含防護措施,以防止創建有害內容。

Google 未透露其模型的訓練數據,這是一個因知識產權問題而經常引發爭議的話題。一些公司未經許可使用受版權保護的材料進行 AI 訓練,聲稱受美國公平使用保護,但創作者常在法庭上對此提出質疑。

Google 此前曾向 TechCrunch 表示,它提供模型訓練的退出選項,以及一項保障政策,以保護 Google Cloud 和 Vertex AI 用戶免受與 AI 相關的版權索賠。

相關文章
AI驅動的奧茲巫師將在拉斯維加斯Sphere巨型螢幕上璀璨登場 AI驅動的奧茲巫師將在拉斯維加斯Sphere巨型螢幕上璀璨登場 Sphere Entertainment最近公布了為其獨特的拉斯維加斯場地量身定制的沉浸式《奧茲巫師》計劃,新消息揭示了Google和Magnopus如何利用AI將這部86年的經典電影改進,以適應Sphere巨大的160,000平方英尺半球形顯示螢幕。Google的Cloud和DeepMind部門合作,超越了標準的AI升級方法,打造了一個適用於Sphere 16,000×16,000像素螢幕的《奧
Google揭曉Android XR智慧眼鏡,與Warby Parker合作 Google揭曉Android XR智慧眼鏡,與Warby Parker合作 Google在2025年Google I/O大會上宣布與Gentle Monster和Warby Parker合作,開發基於Android XR的智慧眼鏡,挑戰Meta的Ray-Ban Meta眼鏡。Google去年與Qualcomm和Samsung共同推出Android XR平台。雖然最初未詳細介紹具體設備,但最近的公告透露將與多個合作夥伴打造多款眼鏡和頭顯。週二,Google還擴展了與Sams
Apple探索Safari的AI搜尋整合 Apple探索Safari的AI搜尋整合 Apple正積極探索將AI驅動的搜尋功能整合進Safari。在週三Google的反壟斷審判中,Apple服務資深副總裁Eddy Cue透露,計劃在明年內可能為Safari引入AI搜尋功能,作為持續增強的一部分。“他們還沒完全準備好,”Cue提到,參考了已與Perplexity、OpenAI和Anthropic進行的討論。他強調生成式AI仍處於早期階段,指出Apple與OpenAI在其他AI功能上的
評論 (0)
0/200
回到頂部
OR