DeepMind首席執行官Demis Hassabis宣布了Google的雙子座和VEO AI模型的未來整合

在LinkedIn共同創始人Reid Hoffman共同主持的最近的播客中,Google DeepMind首席執行官Demis Hassabis共同主持了一些有關Google計劃的令人興奮的消息。他透露,Google希望將其雙子座AI模型與VEO視頻生成模型合併。這種融合旨在增強雙子座對物理世界的掌握,使其更擅長理解現實生活中的動態。
哈薩比斯強調,從一開始,雙子座被設計為多模式。他解釋說:“從一開始,我們就一直建立了基礎模型的Gemini。”這種方法背後的動機?可以真正幫助日常生活的通用數字助手的願景。 “一個助手……實際上可以幫助您在現實世界中,”哈薩比斯詳細闡述。
AI行業正在穩步發展您所謂的“ Omni”模型,這些模型能夠處理和綜合各種類型的媒體。例如,Google最新的雙子座迭代不僅可以產生文字,還可以產生音頻和圖像。同時,Openai的Chatgpt默認模型可以當場攪動圖像,包括令人愉悅的吉卜力式藝術。亞馬遜不落後,計劃於今年晚些時候推出“任何一對一”模型。
這些Omni模型需要大量的培訓數據 - 想像一下圖像,視頻,音頻和文本。 Hassabis暗示WEO的視頻數據主要來自YouTube,這是Google擁有的寶庫。他指出:“基本上,通過觀看YouTube視頻(許多YouTube視頻),[VEO 2]可以知道,您知道世界的物理學。”
Google先前曾向TechCrunch提到,其模型可能會在“一些” YouTube內容上培訓,並與與YouTube創作者制定的協議保持一致。值得注意的是,去年,Google擴展了其服務條款,部分是為了訪問更多數據以培訓其AI模型。
相關文章
Inside Google’s AI leap: Gemini 2.5 thinks deeper, speaks smarter and codes faster
Google Inches Closer to Its Vision of a Universal AI AssistantAt this year’s Google I/O event, the company revealed significant upgrades to its Gemini 2.5 series, particularly focu
Google is launching a Gemini integration in Chrome
Introducing Gemini Integration in Chrome: A New Era of AI-Powered BrowsingAt Google I/O 2025, Google made waves by announcing a groundbreaking addition to its Chrome browser—Gemini
Top 100 Announcements from I/O Event
Revolutionizing Search with AI: Google’s Latest BreakthroughsAt yesterday’s Google I/O event, the company unveiled some groundbreaking updates across its suite of AI-driven products. From enhanced search capabilities to new tools designed to fuel creativity and productivity, Google is clearly pushin
評論 (0)
0/200
在LinkedIn共同創始人Reid Hoffman共同主持的最近的播客中,Google DeepMind首席執行官Demis Hassabis共同主持了一些有關Google計劃的令人興奮的消息。他透露,Google希望將其雙子座AI模型與VEO視頻生成模型合併。這種融合旨在增強雙子座對物理世界的掌握,使其更擅長理解現實生活中的動態。
哈薩比斯強調,從一開始,雙子座被設計為多模式。他解釋說:“從一開始,我們就一直建立了基礎模型的Gemini。”這種方法背後的動機?可以真正幫助日常生活的通用數字助手的願景。 “一個助手……實際上可以幫助您在現實世界中,”哈薩比斯詳細闡述。
AI行業正在穩步發展您所謂的“ Omni”模型,這些模型能夠處理和綜合各種類型的媒體。例如,Google最新的雙子座迭代不僅可以產生文字,還可以產生音頻和圖像。同時,Openai的Chatgpt默認模型可以當場攪動圖像,包括令人愉悅的吉卜力式藝術。亞馬遜不落後,計劃於今年晚些時候推出“任何一對一”模型。
這些Omni模型需要大量的培訓數據 - 想像一下圖像,視頻,音頻和文本。 Hassabis暗示WEO的視頻數據主要來自YouTube,這是Google擁有的寶庫。他指出:“基本上,通過觀看YouTube視頻(許多YouTube視頻),[VEO 2]可以知道,您知道世界的物理學。”
Google先前曾向TechCrunch提到,其模型可能會在“一些” YouTube內容上培訓,並與與YouTube創作者制定的協議保持一致。值得注意的是,去年,Google擴展了其服務條款,部分是為了訪問更多數據以培訓其AI模型。



0/200
頭號新聞
Openai增強了AI語音助手以進行更好的聊天
體驗AI驅動的I/O填字遊戲:經典文字遊戲中的現代轉折
創始人說
NotebookLM在全球範圍內擴展,添加幻燈片並增強了事實檢查
NVIDIA首席執行官闡明了對DeepSeek市場影響的誤解
韓國停止在當地商店下載DeepSeek應用程序
Adobe揭幕了10個專業AI代理:發現其業務應用程序
Chatgpt的能源使用低於預期
Openai的O3型號可能比最初想像的要昂貴
Notebooklm添加了Web源發現功能
更多
精選
更多

Claude
認識Claude:您的AI助手智能工作是否希望您有一個知識淵博的同事,他隨時準備

Cici AI
你是否曾經好奇過Cici AI到底是什麼?讓我告訴你,它不僅僅是一個普通的AI聊

Gemini
有沒有想過關於雙子座的嗡嗡聲是什麼?讓我為您分解。雙子座是由Google Dee

DeepSeek
曾經想過什麼是全部意見?讓我為您分解。 DeepSeek不僅是另一個AI平台;無

Grok
聽說過Grok嗎?這是Xai的Nifty AI助手,這一切都是為了給您直接的勺子

ChatGPT
有沒有想過什麼是什麼?好吧,讓我為您分解它 - 聊天不僅僅是您在技術領域的普通喬

OpenAI
有沒有想過Openai周圍的嗡嗡聲是什麼?好吧,讓我為您分解。 Openai不僅

Tencent Hunyuan
騰訊hunyuan-large,是嗎?就像騰訊技術巨頭開發的AI模型的瑞士軍刀一

Qwen AI
有沒有想過Qwen AI是什麼?好吧,讓我向您介紹阿里巴巴雲的這顆寶石。 Qwe

Runway
有沒有想過如何將您的常規視頻剪輯變成非凡的東西?好吧,讓我向您介紹跑道,這是一個