DeepMind首席执行官Demis Hassabis宣布了Google的双子座和VEO AI模型的未来整合

首页

新闻

2025-04-26

KeithGonzález

188

# Gemini # veo

DeepMind首席执行官Demis Hassabis宣布了Google的双子座和VEO AI模型的未来整合

在最近一期由LinkedIn联合创始人Reid Hoffman共同主持的播客Possible中，Google DeepMind首席执行官Demis Hassabis分享了关于Google计划的一些激动人心的消息。他透露，Google计划将其Gemini AI模型与Veo视频生成模型合并。这种融合旨在增强Gemini对物理世界的理解，使其更擅长理解现实生活的动态。

Hassabis强调，Gemini从一开始就被设计为多模态。“我们一直以来都将Gemini，我们的基础模型，构建为多模态，”他解释道。这种方法的动机是什么？为一个真正能在日常生活中提供帮助的通用数字助手设定愿景。“一个……在现实世界中真正帮助你的助手，”Hassabis进一步阐述。

AI行业正稳步向所谓的“全能”模型发展——那些能够处理和合成各种类型媒体的模型。例如，Google的最新Gemini版本不仅能生成文本，还能生成音频和图像。与此同时，OpenAI的ChatGPT默认模型可以即时生成图像，包括令人愉悦的吉卜力工作室风格艺术。Amazon也不甘落后，计划在今年晚些时候推出“任意到任意”模型。

这些全能模型需要大量训练数据——包括图像、视频、音频和文本。Hassabis暗示，Veo的视频数据主要来自YouTube，这是Google拥有的一个宝库。“基本上，通过观看YouTube视频——大量的YouTube视频——[Veo 2]可以弄清楚，你知道的，世界的物理规律，”他指出。

Google此前曾对TechCrunch表示，其模型“可能”会使用“一些”YouTube内容进行训练，这与与YouTube创作者达成的协议一致。值得注意的是，去年Google扩展了其服务条款，部分是为了获取更多数据来训练其AI模型。

谷歌将自主AI和氛围编码小工具整合到Android系统中谷歌在周二举行的“Android Show：I/O 特别版”活动上，宣布了一系列隶属于 Gemini Intelligence 品牌的新 AI 功能。这些功能包括让 AI 处理跨多个应用的任务、浏览网页、填写表单、转录语音，甚至还能让你通过“即兴编码”创建自己的 Android 小部件。Gemini功能更强大今年早些时候在三星Galaxy S26发布会上，该公司已为Gemini添加了一些代理能力，

Meta的AI模型表现出色，但开源身份正逐渐削弱开源人工智能领域一直以来都提供了丰富的选择。多年来，开发者可以使用Mistral、Falcon等模型，以及日益增多的开放权重替代方案。但Meta携Llama入局彻底改变了游戏规则。这家拥有30亿用户、海量计算能力以及科技巨头权威的公司，如今正在公开开发——开发者社区对此也予以了关注。到2026年初，Llama生态系统的下载量已突破12亿次——相当于每天约100万次。这为2026年4月8日发生的事

父亲起诉谷歌，指责Gemini聊天机器人导致儿子产生致命妄想 36岁的乔纳森·加瓦拉斯（Jonathan Gavalas）于2025年8月开始使用谷歌的Gemini人工智能聊天机器人，用于购物辅助、写作帮助和旅行规划。10月2日，他自杀身亡。在他去世时，他坚信Gemini是他的全知觉人工智能妻子，并认为自己必须离开肉身，通过他称之为“转世”的过程，在元宇宙中与她团聚。如今，他的父亲以过失致死为由起诉谷歌和Alphabet，指控谷歌在设计Gemini时，旨在“

相关专题推荐

聊天机器人

使用这些角色扮演工具，创作属于你的AI爱情故事

探索2026年最新、最受好评的AI角色扮演工具，打造身临其境的叙事体验。XIX.AI精心整理的这份清单汇集了功能强大、颠覆传统的助手，助您释放创意叙事潜力，挖掘情感深度。通过实际测试对比免费与付费选项。立即开启您的独特旅程。

10 个工具

xix.ai

文字转语音

独立游戏开发者必备的顶级AI配音工具：为RPG和视觉小说节省配音时间

探索2026年最适合游戏开发者的AI配音工具！XIX.AI精心整理的这份清单汇集了广受好评、能彻底改变游戏开发格局的解决方案，助您在角色扮演游戏（RPG）和视觉小说的配音制作中节省时间和成本。了解免费与付费版本的对比分析、实际测试结果以及每周更新的排行榜。立即找到最适合您的配音工具吧！

10 个工具

xix.ai

教育与学习

最佳人工智能间隔重复学习工具：帮助医学生和法律专业学生优化学习计划

探索由 XIX.AI 精心挑选的 2026 年最佳 AI 间隔重复学习工具。我们推荐的这些极具创新性的工具能帮助医学和法律专业的学生优化学习计划，从而提高知识记忆效果。通过真实案例测试和每周更新的排名信息，你可以了解免费选项与付费选项之间的差异。现在就开启你的学习优势吧！

10 个工具

xix.ai

视频创作

最适合剧本创作和视觉叙事的AI文本转视频平台

2026年最新最佳AI文字转视频平台：备受好评的剧本创作与视觉叙事工具。探索这些功能强大、颠覆传统的解决方案，将您的文字转化为引人入胜的视频。通过我们每周更新的排行榜和实际测试，对比免费与付费选项。找到最适合您的平台，激发创意，提升效率。立即访问XIX.AI，探索精心精选的优质平台。

10 个工具

xix.ai

聊天机器人

AI多智能体编排器：通过自然语言设计复杂的自动化工作流程

2026最新资讯：探索最优秀的人工智能多智能体协调工具，通过自然语言设计复杂的自动化工作流程。我们精心挑选的列表中包含了评分最高、功能强大的平台，这些平台能够实现无缝的任务自动化和智能化的流程管理。对比免费与付费选项，并了解实际应用中的效果。借助XIX.AI每周更新的专家排名，让你在人工智能领域取得领先优势。

10 个工具

xix.ai

图像编辑

最佳AI降噪软件：消除低光夜间摄影中的颗粒感和伪影

探索2026年最适合低光夜间摄影的AI降噪软件。我们精心挑选了最受欢迎的免费及付费工具，通过实际测试并每周更新排名来进行对比。轻松去除图像中的颗粒感与瑕疵，在XIX.AI上释放你的AI潜力。

10 个工具

xix.ai

0/500

请登录后再操作

EdwardJackson

2026-04-02 22:00:37

The integration of Gemini and Veo sounds promising! Could this be the key to generating truly coherent multimodal content, or are we just stitching together different black boxes? The computational cost for such combined models might be enormous though. A fascinating glimpse into the future roadmap of Google's AI.

RalphSanchez

2025-08-01 10:48:18

Wow, merging Gemini with Veo sounds like a game-changer! Can't wait to see how this powers up video creation. But, like, is Google trying to dominate every AI corner now? 😅

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Ramp 数据显示企业人工智能应用趋于平稳 Bing图像创建者教程：AI艺术生成指南学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 Embodied Intelligence 发布首个行业标准，旨在遏制无序增长 DeepSeek V4 作为多模态人工智能变革者横空出世

精选