I/O 2024的前100个公告揭示了

首页

新闻

I/O 2024的前100个公告揭示了

2025-04-10

ArthurJones

203

# ai

I/O 2024的前100个公告揭示了

哇，I/O 2024 充满了激动人心的更新！无论你是热衷于最新的 Gemini 应用增强功能，渴望体验新的开发者工具，还是迫不及待想尝试最新的生成式 AI 功能，总有一款适合你。不相信我们的话？来看看我们在过去几天宣布的100件事吧。

AI时刻与模型动能

我们推出了 Gemini 1.5 Flash，这是一个为速度和效率设计的轻量级模型。它是API中可用的最快的 Gemini 模型。
我们对1.5 Pro进行了显著改进，这是我们在各种任务中表现最佳的顶级模型。
1.5 Pro 和 1.5 Flash 现已在 Google AI Studio 和 Vertex AI 上以100万 token 的上下文窗口进行公开预览。
1.5 Pro 还可以通过 Google AI Studio 和 Vertex AI 的等待列表，以200万 token 的上下文窗口供开发者使用。

与 Gemini 1.5 的200万 token 能力相比，领先基础模型的上下文长度。

我们分享了 Project Astra，这是我们对未来 AI 助手的愿景。
我们宣布了 Trillium，这是我们定制 AI 加速器的第六代，即张量处理单元（TPU）。它是有史以来性能最强的 TPU。
与 TPU v5e 相比，Trillium TPU 的单芯片峰值计算性能提高了4.7倍。
它们还是我们最具可持续性的一代：Trillium TPU 的能效比 TPU v5e 高出67%以上。
我们展示了 NotebookLM 的 Audio Overviews 早期原型，它使用上传的材料创建个性化的口头讨论。
我们宣布了与 Google Search 的 Grounding 功能，将 Gemini 模型与世界知识和最新的互联网信息连接起来，现已在 Vertex AI 上普遍可用。
我们在 Gemini API 和 AI Studio 中添加了音频理解功能，使 Gemini 1.5 Pro 可以处理 AI Studio 中上传的视频的图像和音频。
从 Pixel 开始，使用 Gemini Nano 的多模态应用将像人类一样理解世界——通过文本、视觉、声音和口语。

生成式媒体模型与实验室实验

我们宣布了 Imagen 3，这是我们迄今为止最高质量的图像生成模型。
Imagen 3 能理解自然语言和提示背后的意图，结合较长提示中的小细节，生成细节惊艳、逼真的照片图像，与我们之前的模型相比，视觉伪影更少。
Imagen 3 还是我们迄今为止在渲染文本方面表现最好的模型，这是图像生成模型的一大挑战。
我们将 Imagen 3 推广给 ImageFX 中的受信任测试者，你可以注册加入等待列表。
Imagen 3 将于今年夏天在 Vertex AI 上可用。
我们宣布了 Veo，这是我们迄今为止最强大的视频生成模型，可以生成超过一分钟的高质量1080p分辨率视频，涵盖各种电影和视觉风格。
我们将把 Veo 的部分功能带到 YouTube Shorts 和其他产品中。
我们展示了 Veo 为艺术家带来的可能性，通过与包括唐纳德·格洛弗在内的电影制作者合作，使用 Veo 进行电影项目。
我们展示了 Music AI Sandbox，这是一套音乐 AI 工具，让人们可以创建新的器乐部分、在不同曲目之间转换风格等。你可以在 YouTube 上找到与 Wyclef Jean 和 Marc Rebillet 合作的新歌曲。
查看《无限仙境》，艺术家和 Google 创意人员微调了一个 AI 模型，以无尽地重塑《爱丽丝漫游奇境记》的视觉世界。读者可以根据每位艺术家的风格，为书中1200句话生成无限图像。
我们宣布了 VideoFX，这是我们最新的实验工具，使用 Google DeepMind 的生成视频模型 Veo，将创意转化为视频片段。
VideoFX 还包括一个 Storyboard 模式，让你逐场景迭代并为最终视频添加音乐。

25. 我们为 ImageFX 添加了更多编辑控制——这是社区的首要请求——让你可以通过简单地在图像上刷动来添加、移除或更改元素。 26. ImageFX 将使用 Imagen 3 解锁更多真实感，带来更丰富的细节、更少的视觉伪影和更准确的文本渲染。 27. MusicFX 现在有了“DJ模式”，帮助你通过结合流派和乐器来混合节拍，使用生成式 AI 将音乐故事带入生活。 28. 本周起，ImageFX 和 MusicFX 通过 Labs 在超过100个国家可用。

用 Gemini 应用完成更多任务的新方式

我们将 Gemini 1.5 Pro 引入 Gemini Advanced 订阅者，为他们提供100万 token 的上下文窗口和处理1500页 PDF 的能力。
这也意味着 Gemini Advanced 现在拥有任何商业可用聊天机器人中最大的上下文窗口。
我们增加了通过 Google Drive 或直接从你的设备上传文件到 Gemini Advanced 的功能。
很快，Gemini Advanced 将帮助你分析数据以发现洞察，并从上传的数据文件（如电子表格）构建图表。
对旅行者来说是个好消息：Gemini Advanced 现在有一个规划功能，超越了建议活动列表，为你创建定制的行程。

34. 还有 Gemini Advanced 订阅者的 Gemini Live，这是一个全新的、以移动为先的对话体验，使用最先进的语音技术，与 Gemini 进行更自然、直观的口头对话。 35. Gemini Live 让你可以从10种自然音色的声音中选择，你可以按照自己的节奏说话，或在回复中途打断以提出澄清问题。 36. Google Messages 中的 Gemini 现在让你可以在与朋友聊天的同一应用中与 Gemini 聊天。 37. Gemini Advanced 订阅者很快将能够创建 Gems，这是为你的任何梦想定制的 Gemini 版本。只需描述你希望你的 Gem 做什么以及如何回应，Gemini 将为你特定需求创建一个 Gem。 38. 留意更多与 Gemini 连接的 Google 工具，包括 Google Calendar、Tasks、Keep 和 Clock。

让搜索为你完成工作的更新

我们使用为 Google Search 定制的新 Gemini 模型，将 Gemini 的高级功能——如多步骤推理、规划和多模态——与我们一流的搜索系统结合在一起。
搜索中的 AI Overviews 本周将在美国向所有人推出，更多国家即将推出。

41. 多步骤推理功能很快将在美国针对英文查询的 Search Labs 中推出 AI Overviews，让你可以提出复杂问题，如“找到波士顿最好的瑜伽或普拉提工作室，并显示它们的入门优惠和从 Beacon Hill 步行时间详情”。 42. 很快，你将能够调整你的 AI Overview，选择简化语言或更详细地分解内容，特别是在你对某个主题不熟悉或试图深入了解时。 43. 搜索还将获得新的规划功能。例如，餐食和旅行规划的定制功能将在今年晚些时候在 Search Labs 中推出，之后还将扩展到派对和健身等更多类别。 44. 得益于视频理解的进步，你现在可以用视频提出问题。搜索可以处理复杂的视觉问题，为你解答，然后通过 AI Overview 提供下一步和资源。 45. 搜索中的生成式 AI 很快将为你搜索新创意时创建 AI 组织的搜索结果页面。这些 AI 组织的搜索结果页面将适用于餐饮、食谱、电影、音乐、书籍、酒店、购物等类别。

Workspace 和 Photos 中的 Gemini 模型帮助

Gemini 1.5 Pro 现已在 Gmail、Docs、Drive、Slides 和 Sheets 的侧面板中通过 Workspace Labs 提供，并将于下个月向我们的 Gemini for Workspace 客户和 Google One AI Premium 订阅者推出。
你将能够使用 Gmail 的侧面板来总结电子邮件并获取最重要的细节和行动项目。
除了摘要外，Gmail 的移动应用很快将使用 Gemini 提供两个新功能：Contextual Smart Reply 和 Gmail Q&A。
未来几周，Gmail 和 Docs 中的“帮助我写作”将支持西班牙语和葡萄牙语。
今年晚些时候在 Labs 中，你可以要求 Gemini 自动在 Drive 中组织电子邮件附件，生成包含数据的表格，然后使用 Data Q&A 进行分析。
Google Photos 中的一项新实验功能 Ask Photos 使查找特定回忆或回忆画廊中的信息变得更容易。该功能使用 Gemini 模型，将在未来几个月推出。

52. 你还可以使用 Ask Photos 从最近的旅行中创建亮点画廊，它甚至会为你编写个性化字幕以在社交媒体上分享。

Android 进步

从今年晚些时候的 Pixel 开始，Gemini Nano——Android 内置的设备端基础模型——将具备多模态功能。你的 Pixel 手机将更能理解上下文中的信息，如视觉、声音和口语。
Talkback 是 Android 设备的一项辅助功能，通过触摸和语音反馈帮助盲人和低视力人群使用设备，得益于 Gemini Nano 的多模态功能而得到改进。
一项新的可选防诈骗保护功能将使用 Gemini Nano 的设备端 AI 以保护隐私的方式帮助检测诈骗电话。更多细节将在今年晚些时候公布。
我们宣布 Circle to Search 目前已在超过1亿台 Android 设备上可用，我们有望在年底前翻倍。
很快，你将能够在 Android 上使用 Gemini 创建并拖放生成的图像到 Gmail、Google Messages 等，或询问你正在观看的 YouTube 视频。
如果你有 Gemini Advanced，你还将有“询问此 PDF”选项，以快速获取答案而无需翻阅多页。
学生现在可以直接从选定的 Android 手机和平板电脑使用 Circle to Search 获取作业帮助。此功能由 LearnLM 提供支持，这是基于 Gemini 微调用于学习的新模型系列。
今年晚些时候，Circle to Search 将能够解决涉及符号公式、图表、图形等更复杂的问题。

61. 哦，我们还介绍了 Android 15 的第二个测试版。 62. 防盗锁使用强大的 Google AI 感知你的设备是否被抢夺，并迅速锁定你的手机信息。 63. Android 15 将推出私人空间，让你可以选择将应用保持在需要额外认证才能打开的独立空间中。 64. 如果单独的锁屏不足以保护你的私人空间，你可以完全隐藏它的存在。 65. 今年晚些时候，Google Play Protect 将使用设备端 AI 帮助发现试图隐藏其行为以进行欺诈或钓鱼的应用程序。 66. 我们为日本带来了更新的消息体验，在 Google Messages 中支持 RCS。 67. 很快在美国，你将能够创建仅包含文本的数字通行证。只需拍摄通行证（如保险卡或活动门票）的照片，即可轻松添加到你的 Google Wallet 以便快速访问。 68. 我们展示了增强现实内容将如何直接在 Google Maps 中可用，为我们与三星和 Qualcomm 合作构建的 Android 生态系统扩展现实（XR）平台奠定基础。 69. 你现在可以在配备 Google 内置系统的选定汽车上观看 Max 和 Peacock 的节目，或玩 Angry Birds 游戏。 70. 我们还将 Google Cast 带到配备 Android Automotive OS 的汽车上，从 Rivian 开始将在未来几个月推出，让你轻松从手机将视频内容投射到车内。 71. 今年晚些时候，Wear OS 5 的手表将迎来电池寿命优化。例如，与 Wear OS 4 的手表相比，户外马拉松将消耗高达20%的电量。 72. Wear OS 5 还将为健身应用提供支持更多数据类型的选项，如地面接触时间、步幅长度和垂直振荡。 73. 借助我们的 Gemini 模型，Google TV 和其他 Android TV OS 设备现在更容易选择观看内容，提供个性化的 AI 生成描述。 74. 这些 AI 生成的描述还将填补电影和节目的缺失或未翻译的描述。 75. 这是一个有趣的数据：自推出以来，人们已经建立了超过10亿次 Fast Pair 连接。 76. 本月晚些时候，你将能够使用 Fast Pair 通过 Chipolo 和 PebbleBee 的蓝牙追踪器标签（未来会有更多合作伙伴）在 Find My Device 应用中连接和查找钥匙、钱包或行李等物品。

开发者进展

你可以加入 Gemini API 开发者竞赛，参与发现最有帮助和突破性的 AI 应用。奖品？一辆电改装的定制1981年 DeLorean。
我们介绍了 PaliGemma，这是我们首个针对视觉问答和图像字幕优化的视觉-语言开源模型。
我们预览了 Gemma 的下一个版本，Gemma 2。它基于全新架构构建，将包括一个更大的27B参数实例，性能超过两倍于其大小的模型，并可在单个 TPU 主机上运行。

80. Gemini 模型现可帮助开发者在 Android Studio、IDX、Firebase、Colab、VSCode、Cloud 和 IntelliJ 中提高生产力。 81. Gemini 1.5 Pro 将于今年晚些时候进入 Android Studio。凭借大上下文窗口，该模型带来更高质量的响应，并解锁多模态输入等用例。 82. Google AI Studio 现已在包括英国和欧盟在内的200多个国家可用。 83. Gemini API 现支持并行函数调用和视频帧提取。 84. 下个月，Gemini API 中的新上下文缓存功能将使你能够通过缓存常用上下文文件以较低成本优化大型提示的工作流程。 85. Android 现在为 Kotlin 多平台提供一流支持，帮助开发者跨平台共享应用的业务逻辑。 86. 可调整大小的模拟器、Compose UI 检查模式和由 Firebase 提供支持的 Android 设备流式传输是帮助开发者为所有设备形态构建的新产品。 87. 从 Chrome 126 开始，Gemini Nano 将内置于 Chrome 桌面客户端中。 88. 多页面应用的 View Transitions API，这是一个备受请求的功能，现已可用，开发者可以轻松构建平滑、流畅的类应用导航，无论网站架构如何。 89. Project IDX，我们为全栈、多平台应用打造的新集成开发者体验，现已向所有人开放试用。 90. Firebase 发布了 beta 版的 Firebase Genkit，这将使开发者更轻松地将生成式 AI 体验构建到他们的应用中。 91. Firebase 还发布了 Firebase Data Connect，这是开发者在 Firebase（通过 Google Cloud SQL）中使用 SQL 的新方式。这不仅将 SQL 工作流程带入 Firebase，还将减少开发者需要编写的应用代码量。 92. 我们与 James Manyika、Jeff Dean 和 Koray Kavukcuoglu 深入探讨了推动我们 AI 的技术和研究。

负责任的 AI 进展

我们正在通过一种我们称为“AI 辅助红队测试”的新技术增强红队测试——一种我们主动测试系统弱点并尝试打破它们的成熟实践。
我们还将 SynthID 扩展到两种新模态：文本和视频。
SynthID 文本水印将在未来几个月通过我们更新的 Responsible Generative AI 工具包开源。
我们宣布了 LearnLM，这是基于 Gemini 并为学习微调的新模型系列。LearnLM 已经为我们的产品提供了一系列功能，包括 Gemini、Search、YouTube 和 Google Classroom。

97. 我们将与哥伦比亚教师学院、亚利桑那州立大学、纽约大学 Tisch 学院和可汗学院等机构的专家合作，完善并扩展 LearnLM，超越我们的产品。 98. 我们还与 MIT RAISE 合作开发了一门在线课程，帮助教育工作者在课堂上有效使用生成式 AI。 99. 我们构建了一个名为 Illuminate 的新实验工具，使知识更易获取和消化。 100. Illuminate 可以生成由两个 AI 生成的声音组成的对话，提供研究论文关键洞察的概述。你可以今天在 labs.google 注册试用。

Notion 将其工作区转变为人工智能代理的枢纽生产力软件公司 Notion 正迈入智能代理时代。在周三的一场直播产品发布会上，以协作式笔记应用而闻名的 Notion 推出了一款全新的开发者平台。该平台不仅扩展了其定制 AI 代理的功能，还能与外部代理连接，并允许团队构建能够从任何数据库提取数据的自动化多步骤工作流。通过构建一个编排层——即一个能在多个工具和数据源之间协调AI工作的系统——Notion将自身定位为不仅仅是一款具备AI功能的笔记应

ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单，该轮融资最初于2月宣布。其中包括贝莱德（BlackRock）、威灵顿（Wellington）、D.E. Shaw和施罗德（Schroders）等机构投资者；英伟达（NVIDIA）、Salesforce、桑坦德银行（Santander）、KPN和德国电信（Deutsche Telekom）等企业；以及杰米·福克斯（Jam

WordPress.com 现已支持 AI 助手撰写和发布文章，还有更多功能广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布，将允许人工智能助手在用户网站上起草、编辑和发布内容，同时还能管理评论、更新和修正元数据，并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制，网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能，网站几乎可以完全由人工指导的AI代理来创建和运

相关专题推荐

写作

最适合广播和播客使用的AI脚本编写工具：帮助您创作引人入胜的音频广告

在XIX.AI上，发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能，帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名，您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧！

10 个工具

xix.ai

商业

最佳 AI 合同审查软件：即时发现法律漏洞与合规风险

在 XIX.AI 上探索 2026 年最佳 AI 合同审查软件。我们精心筛选的顶级榜单汇集了功能强大的工具，能够即时发现法律漏洞和合规风险。通过实际测试和每周更新的排名，对比免费与付费选项。找到能彻底改变游戏规则的解决方案，实现安全、高效的合同分析。立即探索这本权威指南。

10 个工具

xix.ai

动画创作

专为东华设计的AI动漫生成器：可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具，能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项，找到最适合你的创作工具，今天就在XIX.AI上将你的故事变为现实吧。

10 个工具

xix.ai

漫画创作

漫画领域顶尖的AI自动上色工具：零一致性错误地应用平涂色彩

立即访问 XIX.AI，探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案，这些工具能以零一致性错误的方式应用平涂色彩，从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜，找到最适合您的工具。立即开启您的 AI 优势。

10 个工具

xix.ai

写作

顶尖 AI 角色设定生成器：生成一致的角色动机与致命缺陷

探索2026年最优秀的AI人物设定生成工具，助您塑造鲜活立体的角色。XIX.AI精心筛选的这份清单汇集了广受好评、颠覆传统的工具，能够生成具有内在逻辑的动机和致命缺陷。通过实际测试对比免费与付费选项。立即释放您的叙事潜能。

10 个工具

xix.ai

商业

顶级 AI 定价优化软件：追踪竞争对手并自动调整店铺价格

在 XIX.AI 上探索 2026 年最佳 AI 定价优化软件。我们精心挑选的清单汇集了备受好评、具有颠覆性意义的工具，这些工具不仅能追踪竞争对手，还能自动调整您的店铺价格，从而实现利润最大化。通过实际测试对比免费与付费选项。立即掌握您的定价优势。

10 个工具

xix.ai

0/500

请登录后再操作

RogerGonzalez

2026-03-19 02:00:47

100 anuncios es mucho... 🤯 Me sorprendió la lista de herramientas para desarrolladores. ¿Alguien más teme estar quedándose atrás con tantas novedades de IA?

SamuelRoberts

2026-02-05 20:03:11

Achei incrível como a Google apresentou tantas novidades de uma vez! Só a parte dos aprimoramentos do Gemini já parece um jogo mudado pra desenvolvedores. Mas confesso que fico meio confuso de ver tanta coisa nova de IA saindo todo mês... Será que a gente não tá indo rápido demais? 🤔 Enfim, mal posso esperar pra testar essas ferramentas na prática!

WalterWalker

2025-12-09 10:30:34

Google I/O 2024の発表内容は多岐にわたりますね。特に新しい生成AIの機能に興味があります。一般ユーザーとして、これらのツールが実際にどれだけ使いやすくなるのか、プライバシーは守られるのか、少し不安もありますが、期待しています！ 🤔 開発者ツールの強化も気になります。

GaryTaylor

2025-10-31 04:30:38

Cette liste des 100 annonces est impressionnante! 🤯 L'amélioration des outils pour développeurs est particulièrement intéressante, mais ça va être difficile de tout suivre. J'espère que l'accessibilité sera au rendez-vous et pas seulement pour les initiés.

LarryWilliams

2025-10-15 08:30:34

Alors là, la mise à jour de Gemini m'a vraiment bluffé ! 📱 Mais je me demande si ces nouvelles fonctionnalités d'IA générative ne vont pas finir par surcharger nos téléphones... Ça va devenir gourmand en batterie ou pas ? 🤔 Vraiment hâte de tester ça en vrai !

DennisMitchell

2025-08-18 03:01:00

The I/O 2024 updates blew my mind! 😍 Those new Gemini app features are slick, but I'm really curious how devs will use those generative AI tools. Anyone else hyped to see what apps come out of this?

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Ramp 数据显示企业人工智能应用趋于平稳 Bing图像创建者教程：AI艺术生成指南学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 DeepSeek V4 作为多模态人工智能变革者横空出世 Embodied Intelligence 发布首个行业标准，旨在遏制无序增长

精选