DeepMind首席执行官Demis Hassabis宣布了Google的双子座和VEO AI模型的未来整合

在LinkedIn共同创始人Reid Hoffman共同主持的最近的播客中,Google DeepMind首席执行官Demis Hassabis共同主持了一些有关Google计划的令人兴奋的消息。他透露,Google希望将其双子座AI模型与VEO视频生成模型合并。这种融合旨在增强双子座对物理世界的掌握,使其更擅长理解现实生活中的动态。
哈萨比斯强调,从一开始,双子座被设计为多模式。他解释说:“从一开始,我们就一直建立了基础模型的Gemini。”这种方法背后的动机?可以真正帮助日常生活的通用数字助手的愿景。 “一个助手……实际上可以帮助您在现实世界中,”哈萨比斯详细阐述。
AI行业正在稳步发展您所谓的“ Omni”模型,这些模型能够处理和综合各种类型的媒体。例如,Google最新的双子座迭代不仅可以产生文字,还可以产生音频和图像。同时,Openai的Chatgpt默认模型可以当场搅动图像,包括令人愉悦的吉卜力式艺术。亚马逊不落后,计划于今年晚些时候推出“任何一对一”模型。
这些Omni模型需要大量的培训数据 - 想象一下图像,视频,音频和文本。 Hassabis暗示WEO的视频数据主要来自YouTube,这是Google拥有的宝库。他指出:“基本上,通过观看YouTube视频(许多YouTube视频),[VEO 2]可以知道,您知道世界的物理学。”
Google先前曾向TechCrunch提到,其模型可能会在“一些” YouTube内容上培训,并与与YouTube创作者制定的协议保持一致。值得注意的是,去年,Google扩展了其服务条款,部分是为了访问更多数据以培训其AI模型。
相关文章
Inside Google’s AI leap: Gemini 2.5 thinks deeper, speaks smarter and codes faster
Google Inches Closer to Its Vision of a Universal AI AssistantAt this year’s Google I/O event, the company revealed significant upgrades to its Gemini 2.5 series, particularly focu
Google is launching a Gemini integration in Chrome
Introducing Gemini Integration in Chrome: A New Era of AI-Powered BrowsingAt Google I/O 2025, Google made waves by announcing a groundbreaking addition to its Chrome browser—Gemini
Top 100 Announcements from I/O Event
Revolutionizing Search with AI: Google’s Latest BreakthroughsAt yesterday’s Google I/O event, the company unveiled some groundbreaking updates across its suite of AI-driven products. From enhanced search capabilities to new tools designed to fuel creativity and productivity, Google is clearly pushin
评论 (0)
0/200
在LinkedIn共同创始人Reid Hoffman共同主持的最近的播客中,Google DeepMind首席执行官Demis Hassabis共同主持了一些有关Google计划的令人兴奋的消息。他透露,Google希望将其双子座AI模型与VEO视频生成模型合并。这种融合旨在增强双子座对物理世界的掌握,使其更擅长理解现实生活中的动态。
哈萨比斯强调,从一开始,双子座被设计为多模式。他解释说:“从一开始,我们就一直建立了基础模型的Gemini。”这种方法背后的动机?可以真正帮助日常生活的通用数字助手的愿景。 “一个助手……实际上可以帮助您在现实世界中,”哈萨比斯详细阐述。
AI行业正在稳步发展您所谓的“ Omni”模型,这些模型能够处理和综合各种类型的媒体。例如,Google最新的双子座迭代不仅可以产生文字,还可以产生音频和图像。同时,Openai的Chatgpt默认模型可以当场搅动图像,包括令人愉悦的吉卜力式艺术。亚马逊不落后,计划于今年晚些时候推出“任何一对一”模型。
这些Omni模型需要大量的培训数据 - 想象一下图像,视频,音频和文本。 Hassabis暗示WEO的视频数据主要来自YouTube,这是Google拥有的宝库。他指出:“基本上,通过观看YouTube视频(许多YouTube视频),[VEO 2]可以知道,您知道世界的物理学。”
Google先前曾向TechCrunch提到,其模型可能会在“一些” YouTube内容上培训,并与与YouTube创作者制定的协议保持一致。值得注意的是,去年,Google扩展了其服务条款,部分是为了访问更多数据以培训其AI模型。



0/200
头条新闻
Openai增强了AI语音助手以进行更好的聊天
体验AI驱动的I/O填字游戏:经典文字游戏中的现代转折
创始人说
NotebookLM在全球范围内扩展,添加幻灯片并增强了事实检查
NVIDIA首席执行官阐明了对DeepSeek市场影响的误解
韩国停止在当地商店下载DeepSeek应用程序
Adobe揭幕了10个专业AI代理:发现其业务应用程序
Chatgpt的能源使用低于预期
Openai的O3型号可能比最初想象的要昂贵
Notebooklm添加了Web源发现功能
更多
精选
更多

Claude
认识Claude:您的AI助手智能工作是否希望您有一个知识渊博的同事,他随时准备

Cici AI
你是否曾经好奇过Cici AI到底是什么?让我告诉你,它不仅仅是一个普通的AI聊

Gemini
有没有想过关于双子座的嗡嗡声是什么?让我为您分解。双子座是由Google Dee

DeepSeek
曾经想过什么是全部意见?让我为您分解。 DeepSeek不仅是另一个AI平台;无

Grok
听说过Grok吗?这是Xai的Nifty AI助手,这一切都是为了给您直接的勺子

ChatGPT
有没有想过什么是什么?好吧,让我为您分解它 - 聊天不仅仅是您在技术领域的普通乔

OpenAI
有没有想过Openai周围的嗡嗡声是什么?好吧,让我为您分解。 Openai不仅

Tencent Hunyuan
腾讯hunyuan-large,是吗?就像腾讯技术巨头开发的AI模型的瑞士军刀一

Qwen AI
有没有想过Qwen AI是什么?好吧,让我向您介绍阿里巴巴云的这颗宝石。 Qwe

Runway
有没有想过如何将您的常规视频剪辑变成非凡的东西?好吧,让我向您介绍跑道,这是一个