选项
首页
新闻
Google I/O 2024:揭开下一代的创新

Google I/O 2024:揭开下一代的创新

2025-04-10
103

Google正全面拥抱我们所称的Gemini时代。

在深入探讨细节之前,我想先回顾一下我们目前的进展。我们在过去十多年里持续投入资源于AI,推动研究、产品开发和基础设施的边界。今天,我们将涵盖所有这些内容以及更多。

我们仍处于这一AI平台转型的初期,其潜力巨大——对创作者、开发者、初创公司以及其他所有人来说都是如此。这就是Gemini时代的意义所在:推动这些机会向前发展。那么,让我们直接开始吧。

Gemini时代

去年在I/O大会上,我们公布了Gemini的愿景:一款从一开始就设计为原生多模态的尖端模型,能够处理文本、图像、视频、代码等内容。这是迈向将任何输入转化为任何输出的重要一步——下一代的“I/O”。

自那以后,我们推出了首批Gemini模型,树立了多模态性能的新标准。仅仅两个月后,我们引入了Gemini 1.5 Pro,这在处理长上下文方面取得了重大突破。它在生产环境中可处理100万个令牌,超越了迄今为止任何其他大规模基础模型。

我们致力于确保每个人都能从Gemini的能力中受益。我们迅速采取行动与大家分享这些进步。今天,超过150万开发者在我们的工具中使用Gemini模型,从调试代码到获得新洞察,再到构建下一波AI应用。

我们还将Gemini的强大功能以有意义的方式整合到我们的产品中。今天你将看到在Search、Photos、Workspace、Android等领域的示例。

产品进展

目前,我们所有拥有20亿用户的产品的动力都来自Gemini。

我们还推出了新的体验,包括一个移动应用程序,你可以在其中直接与Gemini互动,适用于Android和iOS。有了Gemini Advanced,你可以访问我们最先进的模型。短短三个月内,已有超过100万人注册尝试,势头持续增强。

在Search中扩展AI Overviews

Gemini在Google Search中的发展是最激动人心的进展之一。

在过去一年中,我们通过Search Generative Experience处理了数十亿次查询。用户以新的方式探索Search,提出更长、更复杂的问题,甚至使用照片进行搜索,获得网络提供的最佳结果。

一台干净、现代的移动设备展示了一组关于沙发的查询的新一代搜索结果,AI Overviews提供了关于面料和清洁沙发的全面回答。

我们已在Labs之外测试了这种体验,我们很高兴看到不仅Search使用量增加,用户满意度也更高。

我很激动地宣布,我们将从本周开始在美国向所有人推出这一完全革新的体验——AI Overviews,更多国家也将很快跟进。

多亏了Gemini,我们正在推动Search可能性的边界,包括在我们自己的产品中。

介绍Ask Photos

以Google Photos为例,我们在近九年前推出了它。它已成为组织生活中最珍贵记忆的首选工具,每天上传超过60亿张照片和视频。

人们喜欢用Photos搜索他们的生活。有了Gemini,我们让这变得更简单。

想象你在停车场,记不起你的车牌号。以前,你需要用关键词搜索Photos,翻阅多年的照片来找它。现在,你可以直接询问Photos。它能识别你经常使用的汽车,找出哪辆是你的,并给你车牌号。

Ask Photos还能帮助你深入挖掘你的回忆。比如你在回忆女儿Lucia的早期里程碑。你可以问Photos:“Lucia什么时候学会游泳的?”

然后你可以继续问更复杂的问题,比如:“展示Lucia的游泳进展如何。”

一台移动设备展示了一系列女孩Lucia在不同游泳场景中的照片。界面上有一个提示,询问‘Lucia的游泳进展如何?’,并显示她的进展。

在这里,Gemini超越了简单搜索,理解不同场景——从泳池圈数到海洋浮潜,再到她游泳证书上的文本和日期。Photos随后将这一切整理成一个总结,让你重温那些美好的回忆。我们将在这个夏天推出Ask Photos,更多功能即将推出。

通过多模态和长上下文解锁更多知识

Gemini的多模态设计旨在解锁各种格式的知识。这是一个理解并连接不同类型输入的模型。

这种方式扩展了我们可以提出的问题类型和获得的答案。长上下文进一步扩展了这一点,使我们能够处理大量信息:数百页文本、几小时音频、一小时视频、整个代码库,甚至96个Cheesecake Factory菜单。

对于那些菜单,你需要一个100万个令牌的上下文窗口,这在Gemini 1.5 Pro中已成为可能。开发者正在以一些非常酷的方式使用它。

一个YouTube播放器展示了一个关于开发者如何使用带有100万个令牌上下文窗口的Gemini 1.5 Pro的演示。

我们在过去几个月里以预览模式推出了带有长上下文的Gemini 1.5 Pro,在翻译、编码和推理方面进行了质量改进。这些更新现已反映在模型中。

我很高兴地宣布,我们将向全球所有开发者提供这个改进版的Gemini 1.5 Pro。此外,带有100万个上下文的Gemini 1.5 Pro现已在Gemini Advanced中直接为消费者提供,支持35种语言。

在私有预览中扩展到200万个令牌

100万个令牌已经开启了新的可能性,但我们并未止步于此。

今天,我们将上下文窗口扩展到200万个令牌,供开发者在私有预览中使用。

在短短几个月内我们取得的进展令人难以置信。这是我们迈向无限上下文终极目标的又一步。

将Gemini 1.5 Pro引入Workspace

我们讨论了两个关键技术进步:多模态和长上下文。两者各自都很强大,但结合在一起,它们解锁了更深层次的能力和智能。

这在Google Workspace中尤为明显。

人们经常在Gmail中搜索他们的邮件。有了Gemini,我们让这变得更强大。例如,作为父母,你想了解孩子的学校活动动态。Gemini可以帮助你跟踪这些信息。

你可以让Gemini总结最近来自学校的邮件。在后台,它会识别相关邮件,甚至分析PDF等附件。你会得到关键点和行动项目的总结。如果你因为旅行错过了PTA会议,而录音长达一小时,Gemini可以从Google Meet中提取重要部分。如果有志愿者召集,而你有空,Gemini可以为你起草回复。

这有无数种方式可以简化你的生活。Gemini 1.5 Pro现已在Workspace Labs中提供。Aparna将分享更多细节。

在NotebookLM中实现音频输出

我们已经看到了文本输出的示例,但有了多模态模型,我们可以做得更多。

我们在这方面取得了进展,还有更多即将推出。NotebookLM中的Audio Overviews展示了这一点。它使用Gemini 1.5 Pro从你的源材料生成个性化和交互式的音频对话。

这就是多模态的潜力。很快,你将能够混合搭配输入和输出。这就是我们所说的下一代“I/O”。但如果我们能走得更远呢?

通过AI代理进一步发展

我们看到的一个激动人心的机会是AI代理。这些是能够推理、规划和记忆的智能系统。它们可以提前思考几步,跨软件和系统工作,代表你完成任务,始终在你的监督下。

我们仍处于早期阶段,但让我给你展示一下我们正在研究的用例。

以购物为例。买鞋子很有趣,但如果不合适,退货就不那么有趣了。

想象如果Gemini能为你处理所有步骤:

  • 搜索你的收件箱找到收据...
  • 从你的邮件中定位订单号...
  • 填写退货表格...
  • 甚至安排UPS取件。

这样是不是简单多了?

让我们考虑一个更复杂的场景。假设你刚搬到芝加哥。Gemini和Chrome可以一起帮助你安顿下来——为你组织、推理和综合信息。

你会想探索城市,找到本地服务,从干洗店到遛狗服务。你还需要在众多网站上更新你的新地址。

Gemini可以管理这些任务,并在需要时询问更多信息,确保你始终掌控一切。

这很关键——在我们开发这些体验时,我们专注于隐私、安全,并让它们对每个人都可访问。

这些是简单示例,但它们展示了我们通过构建提前思考、推理和规划的智能系统来解决的问题类型。

对我们使命的意义

Gemini的强大功能——其多模态、长上下文和代理——使我们更接近我们的终极目标:让AI对每个人都有帮助。

这将是我们实现使命的最大进步:组织全球信息,跨越每一种输入,通过任何输出使其可访问,并以真正有用的方式将全球信息与你的世界信息结合起来。

开拓新领域

要充分发挥AI的潜力,我们需要突破界限。Google DeepMind团队一直在为此努力。

我们看到大家对1.5 Pro及其长上下文窗口表现出了很多兴奋。但开发者也想要更快、更具成本效益的东西。因此,明天我们将推出Gemini 1.5 Flash,这是一个为规模化设计的轻量级模型。它针对低延迟和成本关键的任务进行了优化。1.5 Flash将于周二在AI Studio和Vertex AI上提供。

展望未来,我们一直希望构建一个对日常生活中都有用的通用代理。Project Astra展示了多模态理解和实时对话能力。

一个YouTube播放器展示了一个由我们多模态基础模型支持的原型AI代理的演示,该代理与测试者进行实时交互。

我们在视频和图像生成方面也取得了进展,推出了Veo和Imagen 3,并介绍了Gemma 2.0,我们下一代用于负责任AI创新的开放模型。你可以从Demis Hassabis那里了解更多。

AI时代的基建:介绍Trillium

训练最先进的模型需要大量计算能力。在过去六年中,机器学习计算需求增长了100万倍,每年增加十倍。

Google为此而生。在过去25年里,我们投资于世界级的技术基础设施,从支持Search的尖端硬件到驱动我们AI进步的定制张量处理单元。

Gemini完全在我们第四和第五代TPU上训练和运行。其他领先的AI公司,包括Anthropic,也在我们的TPU上训练了他们的模型。

今天,我们很高兴地宣布我们的第六代TPU,名为Trillium。Trillium是我们迄今为止性能最高、效率最高的TPU,与上一代TPU v5e相比,每芯片计算性能提高了4.7倍。

我们将在2024年底向我们的云客户提供Trillium。

除了我们的TPU,我们还为任何工作负载提供CPU和GPU。这包括我们上个月宣布的新款Axion处理器,这是我们首款基于Arm的定制CPU,提供行业领先的性能和能效。

我们还是首批提供Nvidia尖端Blackwell GPU的云提供商之一,将于2025年初提供。我们与NVIDIA的长期合作使我们能够将Blackwell的突破性能力带给我们的客户。

芯片是我们端到端集成系统的基础部分,从性能优化的硬件和开放软件到灵活的消费模型。这一切在我们的AI Hypercomputer中汇聚,这是一个突破性的超级计算机架构。

企业和开发者正在使用它来应对更复杂的挑战,与仅购买原始硬件和芯片相比,效率提高了两倍多。我们的AI Hypercomputer进步部分得益于我们在数据中心采用的液冷方式。

我们近十年前就开始这样做,远在它成为行业尖端技术之前。今天,我们部署的液冷系统总容量接近1吉瓦,并且还在增长——这是其他任何舰队容量的近70倍。

这一切的基础是我们连接全球基础设施的庞大网络。我们的网络跨越超过200万英里的地面和海底光纤:是下一领先云提供商覆盖范围的10倍以上。

我们将继续进行必要的投资,以推动AI创新并提供最先进的能力。

一个动画时间轴,展示TPU随时间的进展,并介绍了新一代TPU。

Search最激动人心的篇章

我们最大的投资和创新领域之一是我们的创始产品Search。25年前,我们创建了Search,帮助人们在网上信息洪流中导航。

在每次平台转变中,我们都实现了突破,以更好地回答你的问题。在移动设备上,我们解锁了新型的问题和答案——利用更好的上下文、位置感知和实时信息。随着自然语言理解和计算机视觉的进步,我们启用了新的搜索方式,比如用你的声音或哼唱来找到你新喜欢的歌曲,或者用你散步时看到的花的图片来搜索。现在你甚至可以通过Circle to Search找到那些很酷的新鞋。去买吧,你随时可以退货!

当然,Gemini时代的Search将把这一切提升到一个全新的水平,结合我们的基础设施优势、最新AI能力、我们对信息质量的高标准,以及我们连接你与网络丰富内容的数十年经验。结果是一个为你完成工作的产品。

Google Search是将生成式AI应用于人类好奇心规模的产品。这是我们Search最激动人心的篇章。从Liz Reid那里了解更多关于Gemini时代Search的信息。

更智能的Gemini体验

Gemini不仅仅是一个聊天机器人;它被设计为你的个人、有用的助手,可以处理复杂任务并代表你采取行动。

与Gemini的交互应感觉像对话且直观。因此,我们宣布了一种新的Gemini体验,称为Live,允许你使用语音与Gemini进行深入对话。我们还将在今年晚些时候为Gemini Advanced带来200万个令牌,使上传和分析超密集文件(如视频和长代码)成为可能。Sissie Hsiao分享更多细节。

Android上的Gemini

全球有数十亿Android用户,我们很高兴将Gemini更深入地整合到用户体验中。作为你的新AI助手,Gemini随时随地为你提供帮助。我们已将Gemini模型整合到Android中,包括我们最新的设备上模型:Gemini Nano with Multimodality,它处理文本、图像、音频和语音,解锁新体验,同时保持你的信息在设备上的隐私。Sameer Samat在这里分享Android的新闻。

我们对AI的负责任方式

我们继续大胆地迎接AI机会,带着兴奋感。我们也在确保以负责任的方式进行。我们正在开发一种尖端的AI辅助红队技术,借鉴Google DeepMind在AlphaGo等游戏突破中的经验来改进我们的模型。此外,我们已将SynthID,我们的用于识别AI生成内容的水印工具,扩展到两种新模态:文本和视频。James Manyika分享更多。

共同创造未来

这一切展示了我们在采取大胆且负责任的方式使AI对每个人都有帮助方面的重要进展。

我们长期以来一直以AI优先的方式行事。我们数十年的研究领导地位开创了许多现代突破,驱动了我们和行业的AI进步。除此之外,我们还有:

  • 为AI时代构建的世界领先基础设施
  • Search的尖端创新,现由Gemini驱动
  • 以非凡规模帮助的产品——包括15个拥有5亿用户的产品的
  • 以及使每个人——合作伙伴、客户、创作者和你们所有人——能够发明未来的平台。

这一进展只有在我们惊人的开发者社区的支持下才有可能。你们通过每天构建的体验和应用使其成为现实。因此,致敬在Shoreline的每一个人以及全球数百万观看者的你们,让我们共同迎接未来的无限可能。

一个充满彩虹色、曲线和矩形的网格,呈现出现代而充满活力的外观。我们在Google I/O上宣布的一切以及更多。

在你的收件箱中获取更多来自Google的故事。

电子邮件地址你的信息将根据Google的隐私政策使用。

订阅完成。还差一步。

检查你的收件箱以确认你的订阅。

你已经订阅了我们的通讯。

你也可以使用不同的电子邮件地址订阅。

相关文章
Salesforce发布Slack AI数字队友对抗Microsoft Copilot Salesforce发布Slack AI数字队友对抗Microsoft Copilot Salesforce推出全新职场AI策略,在Slack对话中引入专业“数字队友”,公司于周一公布。新工具Agentforce in Slack使企业能够创建和部署任务特定AI代理,搜索职场聊天,访问公司数据,并在员工日常使用的消息平台内执行操作。“正如专业员工协作解决问题,我们的客户需要AI代理协同工作,为客户和员工解决问题,”Salesforce Slack首席产品官Rob Seaman在Ven
甲骨文400亿美元英伟达芯片投资助推德克萨斯AI数据中心 甲骨文400亿美元英伟达芯片投资助推德克萨斯AI数据中心 据《金融时报》报道,甲骨文计划投资约400亿美元购买英伟达芯片,为OpenAI在德克萨斯州开发的大型新数据中心提供动力。这是迄今为止最大的芯片收购交易之一,凸显了对AI计算资源激增的需求。该设施位于德克萨斯州阿比林,是美国首个“星门”数据中心。由OpenAI和软银支持,这是构建大规模AI基础设施的更广泛计划的一部分。该德克萨斯中心计划于明年完工,将提供1.2吉瓦的计算能力,使其跻身全球最大数据中心
Meta AI应用将引入高级订阅和广告 Meta AI应用将引入高级订阅和广告 Meta的AI应用可能很快推出付费订阅服务,效仿OpenAI、Google和Microsoft等竞争对手的做法。在2025年第一季度财报电话会议上,Meta首席执行官马克·扎克伯格概述了高级服务的计划,使用户能够访问增强的计算能力或Meta AI的额外功能。为了与ChatGPT竞争,Meta本周推出了一款独立AI应用,允许用户直接与聊天机器人互动并进行图像生成。该聊天机器人目前拥有近10亿用户,此
评论 (27)
0/200
FredGreen
FredGreen 2025-08-21 15:01:19

Super cool to see Google's AI push at I/O 2024! The Gemini era sounds like a sci-fi movie, but I'm curious how it’ll actually change my daily apps. 😎

TimothyHernández
TimothyHernández 2025-08-08 21:00:59

Wow, Google's AI push at I/O 2024 sounds massive! The Gemini era feels like sci-fi coming to life. Curious how it’ll stack up against competitors. 😎

AlbertRodriguez
AlbertRodriguez 2025-04-25 06:33:43

Google I/O 2024 foi incrível! A era Gemini parece ser o futuro que estávamos esperando. Eles têm trabalhado em IA por tanto tempo e finalmente está dando frutos. Mal posso esperar para ver o que vem a seguir! 🚀

StevenNelson
StevenNelson 2025-04-24 14:18:04

Google I/O 2024は本当に衝撃的だった!ジェミニ時代は待ち望んでいた未来そのものだね。彼らがAIにどれだけ投資してきたかを見ると、次に何が来るのか楽しみで仕方ないよ!🚀

MatthewGonzalez
MatthewGonzalez 2025-04-24 00:59:25

O Google I/O 2024 foi incrível! A era Gemini parece o futuro que estávamos esperando. É legal ver quanto eles investiram em IA ao longo dos anos. Mal posso esperar para ver o que vem por aí! 🚀

ScottWalker
ScottWalker 2025-04-22 20:54:29

Google I/O 2024 was mind-blowing! The Gemini era sounds like the future we've been waiting for. They've been working on AI for so long, and it's finally paying off. Can't wait to see what they come up with next! 🚀

返回顶部
OR