Google I/O 2024：揭开下一代的创新

首页

新闻

2025-04-10

JasonHill

229

# ai

Google正全面拥抱我们所称的Gemini时代。

在深入探讨细节之前，我想先回顾一下我们目前的进展。我们在过去十多年里持续投入资源于AI，推动研究、产品开发和基础设施的边界。今天，我们将涵盖所有这些内容以及更多。

我们仍处于这一AI平台转型的初期，其潜力巨大——对创作者、开发者、初创公司以及其他所有人来说都是如此。这就是Gemini时代的意义所在：推动这些机会向前发展。那么，让我们直接开始吧。

Gemini时代

去年在I/O大会上，我们公布了Gemini的愿景：一款从一开始就设计为原生多模态的尖端模型，能够处理文本、图像、视频、代码等内容。这是迈向将任何输入转化为任何输出的重要一步——下一代的“I/O”。

自那以后，我们推出了首批Gemini模型，树立了多模态性能的新标准。仅仅两个月后，我们引入了Gemini 1.5 Pro，这在处理长上下文方面取得了重大突破。它在生产环境中可处理100万个令牌，超越了迄今为止任何其他大规模基础模型。

我们致力于确保每个人都能从Gemini的能力中受益。我们迅速采取行动与大家分享这些进步。今天，超过150万开发者在我们的工具中使用Gemini模型，从调试代码到获得新洞察，再到构建下一波AI应用。

我们还将Gemini的强大功能以有意义的方式整合到我们的产品中。今天你将看到在Search、Photos、Workspace、Android等领域的示例。

产品进展

目前，我们所有拥有20亿用户的产品的动力都来自Gemini。

我们还推出了新的体验，包括一个移动应用程序，你可以在其中直接与Gemini互动，适用于Android和iOS。有了Gemini Advanced，你可以访问我们最先进的模型。短短三个月内，已有超过100万人注册尝试，势头持续增强。

在Search中扩展AI Overviews

Gemini在Google Search中的发展是最激动人心的进展之一。

在过去一年中，我们通过Search Generative Experience处理了数十亿次查询。用户以新的方式探索Search，提出更长、更复杂的问题，甚至使用照片进行搜索，获得网络提供的最佳结果。

一台干净、现代的移动设备展示了一组关于沙发的查询的新一代搜索结果，AI Overviews提供了关于面料和清洁沙发的全面回答。

我们已在Labs之外测试了这种体验，我们很高兴看到不仅Search使用量增加，用户满意度也更高。

我很激动地宣布，我们将从本周开始在美国向所有人推出这一完全革新的体验——AI Overviews，更多国家也将很快跟进。

多亏了Gemini，我们正在推动Search可能性的边界，包括在我们自己的产品中。

介绍Ask Photos

以Google Photos为例，我们在近九年前推出了它。它已成为组织生活中最珍贵记忆的首选工具，每天上传超过60亿张照片和视频。

人们喜欢用Photos搜索他们的生活。有了Gemini，我们让这变得更简单。

想象你在停车场，记不起你的车牌号。以前，你需要用关键词搜索Photos，翻阅多年的照片来找它。现在，你可以直接询问Photos。它能识别你经常使用的汽车，找出哪辆是你的，并给你车牌号。

Ask Photos还能帮助你深入挖掘你的回忆。比如你在回忆女儿Lucia的早期里程碑。你可以问Photos：“Lucia什么时候学会游泳的？”

然后你可以继续问更复杂的问题，比如：“展示Lucia的游泳进展如何。”

一台移动设备展示了一系列女孩Lucia在不同游泳场景中的照片。界面上有一个提示，询问‘Lucia的游泳进展如何？’，并显示她的进展。

在这里，Gemini超越了简单搜索，理解不同场景——从泳池圈数到海洋浮潜，再到她游泳证书上的文本和日期。Photos随后将这一切整理成一个总结，让你重温那些美好的回忆。我们将在这个夏天推出Ask Photos，更多功能即将推出。

通过多模态和长上下文解锁更多知识

Gemini的多模态设计旨在解锁各种格式的知识。这是一个理解并连接不同类型输入的模型。

这种方式扩展了我们可以提出的问题类型和获得的答案。长上下文进一步扩展了这一点，使我们能够处理大量信息：数百页文本、几小时音频、一小时视频、整个代码库，甚至96个Cheesecake Factory菜单。

对于那些菜单，你需要一个100万个令牌的上下文窗口，这在Gemini 1.5 Pro中已成为可能。开发者正在以一些非常酷的方式使用它。

一个YouTube播放器展示了一个关于开发者如何使用带有100万个令牌上下文窗口的Gemini 1.5 Pro的演示。

我们在过去几个月里以预览模式推出了带有长上下文的Gemini 1.5 Pro，在翻译、编码和推理方面进行了质量改进。这些更新现已反映在模型中。

我很高兴地宣布，我们将向全球所有开发者提供这个改进版的Gemini 1.5 Pro。此外，带有100万个上下文的Gemini 1.5 Pro现已在Gemini Advanced中直接为消费者提供，支持35种语言。

在私有预览中扩展到200万个令牌

100万个令牌已经开启了新的可能性，但我们并未止步于此。

今天，我们将上下文窗口扩展到200万个令牌，供开发者在私有预览中使用。

在短短几个月内我们取得的进展令人难以置信。这是我们迈向无限上下文终极目标的又一步。

将Gemini 1.5 Pro引入Workspace

我们讨论了两个关键技术进步：多模态和长上下文。两者各自都很强大，但结合在一起，它们解锁了更深层次的能力和智能。

这在Google Workspace中尤为明显。

人们经常在Gmail中搜索他们的邮件。有了Gemini，我们让这变得更强大。例如，作为父母，你想了解孩子的学校活动动态。Gemini可以帮助你跟踪这些信息。

你可以让Gemini总结最近来自学校的邮件。在后台，它会识别相关邮件，甚至分析PDF等附件。你会得到关键点和行动项目的总结。如果你因为旅行错过了PTA会议，而录音长达一小时，Gemini可以从Google Meet中提取重要部分。如果有志愿者召集，而你有空，Gemini可以为你起草回复。

这有无数种方式可以简化你的生活。Gemini 1.5 Pro现已在Workspace Labs中提供。Aparna将分享更多细节。

在NotebookLM中实现音频输出

我们已经看到了文本输出的示例，但有了多模态模型，我们可以做得更多。

我们在这方面取得了进展，还有更多即将推出。NotebookLM中的Audio Overviews展示了这一点。它使用Gemini 1.5 Pro从你的源材料生成个性化和交互式的音频对话。

这就是多模态的潜力。很快，你将能够混合搭配输入和输出。这就是我们所说的下一代“I/O”。但如果我们能走得更远呢？

通过AI代理进一步发展

我们看到的一个激动人心的机会是AI代理。这些是能够推理、规划和记忆的智能系统。它们可以提前思考几步，跨软件和系统工作，代表你完成任务，始终在你的监督下。

我们仍处于早期阶段，但让我给你展示一下我们正在研究的用例。

以购物为例。买鞋子很有趣，但如果不合适，退货就不那么有趣了。

想象如果Gemini能为你处理所有步骤：

搜索你的收件箱找到收据...
从你的邮件中定位订单号...
填写退货表格...
甚至安排UPS取件。

这样是不是简单多了？

让我们考虑一个更复杂的场景。假设你刚搬到芝加哥。Gemini和Chrome可以一起帮助你安顿下来——为你组织、推理和综合信息。

你会想探索城市，找到本地服务，从干洗店到遛狗服务。你还需要在众多网站上更新你的新地址。

Gemini可以管理这些任务，并在需要时询问更多信息，确保你始终掌控一切。

这很关键——在我们开发这些体验时，我们专注于隐私、安全，并让它们对每个人都可访问。

这些是简单示例，但它们展示了我们通过构建提前思考、推理和规划的智能系统来解决的问题类型。

对我们使命的意义

Gemini的强大功能——其多模态、长上下文和代理——使我们更接近我们的终极目标：让AI对每个人都有帮助。

这将是我们实现使命的最大进步：组织全球信息，跨越每一种输入，通过任何输出使其可访问，并以真正有用的方式将全球信息与你的世界信息结合起来。

开拓新领域

要充分发挥AI的潜力，我们需要突破界限。Google DeepMind团队一直在为此努力。

我们看到大家对1.5 Pro及其长上下文窗口表现出了很多兴奋。但开发者也想要更快、更具成本效益的东西。因此，明天我们将推出Gemini 1.5 Flash，这是一个为规模化设计的轻量级模型。它针对低延迟和成本关键的任务进行了优化。1.5 Flash将于周二在AI Studio和Vertex AI上提供。

展望未来，我们一直希望构建一个对日常生活中都有用的通用代理。Project Astra展示了多模态理解和实时对话能力。

一个YouTube播放器展示了一个由我们多模态基础模型支持的原型AI代理的演示，该代理与测试者进行实时交互。

我们在视频和图像生成方面也取得了进展，推出了Veo和Imagen 3，并介绍了Gemma 2.0，我们下一代用于负责任AI创新的开放模型。你可以从Demis Hassabis那里了解更多。

AI时代的基建：介绍Trillium

训练最先进的模型需要大量计算能力。在过去六年中，机器学习计算需求增长了100万倍，每年增加十倍。

Google为此而生。在过去25年里，我们投资于世界级的技术基础设施，从支持Search的尖端硬件到驱动我们AI进步的定制张量处理单元。

Gemini完全在我们第四和第五代TPU上训练和运行。其他领先的AI公司，包括Anthropic，也在我们的TPU上训练了他们的模型。

今天，我们很高兴地宣布我们的第六代TPU，名为Trillium。Trillium是我们迄今为止性能最高、效率最高的TPU，与上一代TPU v5e相比，每芯片计算性能提高了4.7倍。

我们将在2024年底向我们的云客户提供Trillium。

除了我们的TPU，我们还为任何工作负载提供CPU和GPU。这包括我们上个月宣布的新款Axion处理器，这是我们首款基于Arm的定制CPU，提供行业领先的性能和能效。

我们还是首批提供Nvidia尖端Blackwell GPU的云提供商之一，将于2025年初提供。我们与NVIDIA的长期合作使我们能够将Blackwell的突破性能力带给我们的客户。

芯片是我们端到端集成系统的基础部分，从性能优化的硬件和开放软件到灵活的消费模型。这一切在我们的AI Hypercomputer中汇聚，这是一个突破性的超级计算机架构。

企业和开发者正在使用它来应对更复杂的挑战，与仅购买原始硬件和芯片相比，效率提高了两倍多。我们的AI Hypercomputer进步部分得益于我们在数据中心采用的液冷方式。

我们近十年前就开始这样做，远在它成为行业尖端技术之前。今天，我们部署的液冷系统总容量接近1吉瓦，并且还在增长——这是其他任何舰队容量的近70倍。

这一切的基础是我们连接全球基础设施的庞大网络。我们的网络跨越超过200万英里的地面和海底光纤：是下一领先云提供商覆盖范围的10倍以上。

我们将继续进行必要的投资，以推动AI创新并提供最先进的能力。

一个动画时间轴，展示TPU随时间的进展，并介绍了新一代TPU。

Search最激动人心的篇章

我们最大的投资和创新领域之一是我们的创始产品Search。25年前，我们创建了Search，帮助人们在网上信息洪流中导航。

在每次平台转变中，我们都实现了突破，以更好地回答你的问题。在移动设备上，我们解锁了新型的问题和答案——利用更好的上下文、位置感知和实时信息。随着自然语言理解和计算机视觉的进步，我们启用了新的搜索方式，比如用你的声音或哼唱来找到你新喜欢的歌曲，或者用你散步时看到的花的图片来搜索。现在你甚至可以通过Circle to Search找到那些很酷的新鞋。去买吧，你随时可以退货！

当然，Gemini时代的Search将把这一切提升到一个全新的水平，结合我们的基础设施优势、最新AI能力、我们对信息质量的高标准，以及我们连接你与网络丰富内容的数十年经验。结果是一个为你完成工作的产品。

Google Search是将生成式AI应用于人类好奇心规模的产品。这是我们Search最激动人心的篇章。从Liz Reid那里了解更多关于Gemini时代Search的信息。

更智能的Gemini体验

Gemini不仅仅是一个聊天机器人；它被设计为你的个人、有用的助手，可以处理复杂任务并代表你采取行动。

与Gemini的交互应感觉像对话且直观。因此，我们宣布了一种新的Gemini体验，称为Live，允许你使用语音与Gemini进行深入对话。我们还将在今年晚些时候为Gemini Advanced带来200万个令牌，使上传和分析超密集文件（如视频和长代码）成为可能。Sissie Hsiao分享更多细节。

Android上的Gemini

全球有数十亿Android用户，我们很高兴将Gemini更深入地整合到用户体验中。作为你的新AI助手，Gemini随时随地为你提供帮助。我们已将Gemini模型整合到Android中，包括我们最新的设备上模型：Gemini Nano with Multimodality，它处理文本、图像、音频和语音，解锁新体验，同时保持你的信息在设备上的隐私。Sameer Samat在这里分享Android的新闻。

我们对AI的负责任方式

我们继续大胆地迎接AI机会，带着兴奋感。我们也在确保以负责任的方式进行。我们正在开发一种尖端的AI辅助红队技术，借鉴Google DeepMind在AlphaGo等游戏突破中的经验来改进我们的模型。此外，我们已将SynthID，我们的用于识别AI生成内容的水印工具，扩展到两种新模态：文本和视频。James Manyika分享更多。

共同创造未来

这一切展示了我们在采取大胆且负责任的方式使AI对每个人都有帮助方面的重要进展。

我们长期以来一直以AI优先的方式行事。我们数十年的研究领导地位开创了许多现代突破，驱动了我们和行业的AI进步。除此之外，我们还有：

为AI时代构建的世界领先基础设施
Search的尖端创新，现由Gemini驱动
以非凡规模帮助的产品——包括15个拥有5亿用户的产品的
以及使每个人——合作伙伴、客户、创作者和你们所有人——能够发明未来的平台。

这一进展只有在我们惊人的开发者社区的支持下才有可能。你们通过每天构建的体验和应用使其成为现实。因此，致敬在Shoreline的每一个人以及全球数百万观看者的你们，让我们共同迎接未来的无限可能。

一个充满彩虹色、曲线和矩形的网格，呈现出现代而充满活力的外观。我们在Google I/O上宣布的一切以及更多。

在你的收件箱中获取更多来自Google的故事。

电子邮件地址你的信息将根据Google的隐私政策使用。

订阅完成。还差一步。

检查你的收件箱以确认你的订阅。

你已经订阅了我们的通讯。

你也可以使用不同的电子邮件地址订阅。

WordPress.com 现已支持 AI 助手撰写和发布文章，还有更多功能广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布，将允许人工智能助手在用户网站上起草、编辑和发布内容，同时还能管理评论、更新和修正元数据，并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制，网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能，网站几乎可以完全由人工指导的AI代理来创建和运

Kakao Mobility 概述了面向物理人工智能的 L4 级自动驾驶路线图 Kakao Mobility 计划内部自主研发 L4 级自动驾驶技术，作为其物理人工智能战略的一部分。在首尔COEX举行的2026世界IT展上，Kakao Mobility副总裁兼物理AI部门负责人金镇奎（Kim Jin-kyu）介绍了该路线图。他的演讲聚焦于物理AI时代基于出行平台构建的自动驾驶服务。据韩联社报道，这场题为“超越构想，付诸行动：AI驱动现实”的活动汇聚了来自17个国家的460

巴里·迪勒：随着通用人工智能的临近，对萨姆·阿尔特曼的信任已无关紧要尽管近期有报道暗示相反的情况，但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周，迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时，为阿尔特曼进行了辩护。此前，阿尔特曼曾遭到一些前同事和董事会成员的指责，称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友，迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言，提问

相关专题推荐

漫画创作

少年漫画顶级AI生成器：打造高能动作场面与特效

在 XIX.AI 探索 2026 年最优秀的少年漫画 AI 生成工具。我们精心筛选的这份高评分清单汇集了强大的工具，助您创作充满张力的动作场面和动态能量特效。通过实际测试对比免费与付费选项。释放您的创作潜能，立即开始创作史诗级漫画吧！

15 个工具

xix.ai

商业

最佳 AI 费用追踪工具：扫描收据并自动分类企业开支

2026年最新最佳AI报销管理工具：广受好评的解决方案，可自动扫描收据并分类企业支出。探索这些功能强大、颠覆传统的解决方案，助您轻松管理报销、精准追踪财务并简化合规流程。我们精心整理并每周更新的免费与付费选项对比指南，助您找到最适合的工具。通过XIX.AI的专家精选，释放您的AI优势。

10 个工具

xix.ai

商业

最佳人工智能招聘工具：筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案，可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名，对比免费与付费选项。立即找到最适合您的招聘助手，优化您的招聘流程！

10 个工具

xix.ai

生产率

AI个人健康与专注力教练：缓解倦怠，提升精神能量

立即访问 XIX.AI，探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具，助您缓解倦怠、提升精神能量。通过真实案例分析，对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具

xix.ai

聊天机器人

备受好评的AI浪漫聊天机器人：凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人，助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人，并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣，立即开始建立联系吧。

10 个工具

xix.ai

教育与学习

最佳AI数据科学导师：精通SQL、Pandas及机器学习工作流程

探索2026年最优秀的人工智能数据科学导师，帮助他们掌握SQL、Pandas以及机器学习工作流程。在XIX.AI上查看我们精心挑选的顶级导师名单，获得强大而具有变革性的指导。通过对比免费和付费选项，并结合实际应用案例进行了解，今天就开启你的数据科学精通之路吧。

10 个工具

xix.ai

0/500

请登录后再操作

WillGarcía

2026-05-20 16:00:26

GoogleがGemini時代を完全に牽引してるね。ただ、競合も同じようなAIを開発してるから、本当に差別化できるのはどこかな？🤔 スーパーAIの倫理面やプライバシー問題はどう解決するのか、少し不安になる。それでも、こうした進化は本当にワクワクするよ！🚀

JimmyGarcia

2026-01-30 14:00:16

Até onde esse hype do 'Era Gemini' vai realmente chegar? Já ouvi discursos assim antes… Será que vai ser mais uma série de funcionalidades legais que só uns poucos vão usar, ou realmente vai mudar a forma como interagimos com a tecnologia? 🤔

StevenWalker

2026-01-19 22:30:48

Гугл опять замахивается на всё сразу 🤦‍♂️ Только что был 'Тензорный' век, а теперь уже 'эра Gemini'. Ну хоть что-то интересное покажут по поиску на этой I/O? А то последнее время воняет шпаргалками из ИИ в результатах поиска, а не настоящими сайтами. Пойдёт он уже в архив или нет?

StevenNelson

2025-10-29 08:30:49

Googleもいよいよ本格的にGeminiに注力するみたいね。でもこのようなAI競争が激化する中で、本当に私たちの生活を豊かにしてくれるのか少し不安…🤔 プライバシーとか雇用への影響も気になるなぁ。

ScottAnderson

2025-08-26 03:01:23

Google's AI push at I/O 2024 sounds like a sci-fi movie! Gemini era? I'm intrigued but also wondering if my phone will soon outsmart me. 😅 Exciting stuff!

FredGreen

2025-08-21 15:01:19

Super cool to see Google's AI push at I/O 2024! The Gemini era sounds like a sci-fi movie, but I'm curious how it’ll actually change my daily apps. 😎

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Ramp 数据显示企业人工智能应用趋于平稳 Bing图像创建者教程：AI艺术生成指南学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 DeepSeek V4 作为多模态人工智能变革者横空出世 Embodied Intelligence 发布首个行业标准，旨在遏制无序增长

精选