选项
首页
新闻
I/O 2024的前100个公告揭示了

I/O 2024的前100个公告揭示了

2025-04-10
131

I/O 2024的前100个公告揭示了

哇,I/O 2024 充满了激动人心的更新!无论你是热衷于最新的 Gemini 应用增强功能,渴望体验新的开发者工具,还是迫不及待想尝试最新的生成式 AI 功能,总有一款适合你。不相信我们的话?来看看我们在过去几天宣布的100件事吧。

AI时刻与模型动能

  1. 我们推出了 Gemini 1.5 Flash,这是一个为速度和效率设计的轻量级模型。它是API中可用的最快的 Gemini 模型。
  2. 我们对1.5 Pro进行了显著改进,这是我们在各种任务中表现最佳的顶级模型。
  3. 1.5 Pro 和 1.5 Flash 现已在 Google AI Studio 和 Vertex AI 上以100万 token 的上下文窗口进行公开预览。
  4. 1.5 Pro 还可以通过 Google AI Studio 和 Vertex AI 的等待列表,以200万 token 的上下文窗口供开发者使用。
与 Gemini 1.5 的200万 token 能力相比,领先基础模型的上下文长度。
  1. 我们分享了 Project Astra,这是我们对未来 AI 助手的愿景。
  2. 我们宣布了 Trillium,这是我们定制 AI 加速器的第六代,即张量处理单元(TPU)。它是有史以来性能最强的 TPU。
  3. 与 TPU v5e 相比,Trillium TPU 的单芯片峰值计算性能提高了4.7倍。
  4. 它们还是我们最具可持续性的一代:Trillium TPU 的能效比 TPU v5e 高出67%以上。
  5. 我们展示了 NotebookLM 的 Audio Overviews 早期原型,它使用上传的材料创建个性化的口头讨论。
  6. 我们宣布了与 Google Search 的 Grounding 功能,将 Gemini 模型与世界知识和最新的互联网信息连接起来,现已在 Vertex AI 上普遍可用。
  7. 我们在 Gemini API 和 AI Studio 中添加了音频理解功能,使 Gemini 1.5 Pro 可以处理 AI Studio 中上传的视频的图像和音频。
  8. 从 Pixel 开始,使用 Gemini Nano 的多模态应用将像人类一样理解世界——通过文本、视觉、声音和口语。

生成式媒体模型与实验室实验

  1. 我们宣布了 Imagen 3,这是我们迄今为止最高质量的图像生成模型。
  2. Imagen 3 能理解自然语言和提示背后的意图,结合较长提示中的小细节,生成细节惊艳、逼真的照片图像,与我们之前的模型相比,视觉伪影更少。
  3. Imagen 3 还是我们迄今为止在渲染文本方面表现最好的模型,这是图像生成模型的一大挑战。
  4. 我们将 Imagen 3 推广给 ImageFX 中的受信任测试者,你可以注册加入等待列表。
  5. Imagen 3 将于今年夏天在 Vertex AI 上可用。
  6. 我们宣布了 Veo,这是我们迄今为止最强大的视频生成模型,可以生成超过一分钟的高质量1080p分辨率视频,涵盖各种电影和视觉风格。
  7. 我们将把 Veo 的部分功能带到 YouTube Shorts 和其他产品中。
  8. 我们展示了 Veo 为艺术家带来的可能性,通过与包括唐纳德·格洛弗在内的电影制作者合作,使用 Veo 进行电影项目。
  9. 我们展示了 Music AI Sandbox,这是一套音乐 AI 工具,让人们可以创建新的器乐部分、在不同曲目之间转换风格等。你可以在 YouTube 上找到与 Wyclef Jean 和 Marc Rebillet 合作的新歌曲。
  10. 查看《无限仙境》,艺术家和 Google 创意人员微调了一个 AI 模型,以无尽地重塑《爱丽丝漫游奇境记》的视觉世界。读者可以根据每位艺术家的风格,为书中1200句话生成无限图像。
  11. 我们宣布了 VideoFX,这是我们最新的实验工具,使用 Google DeepMind 的生成视频模型 Veo,将创意转化为视频片段。
  12. VideoFX 还包括一个 Storyboard 模式,让你逐场景迭代并为最终视频添加音乐。
25. 我们为 ImageFX 添加了更多编辑控制——这是社区的首要请求——让你可以通过简单地在图像上刷动来添加、移除或更改元素。 26. ImageFX 将使用 Imagen 3 解锁更多真实感,带来更丰富的细节、更少的视觉伪影和更准确的文本渲染。 27. MusicFX 现在有了“DJ模式”,帮助你通过结合流派和乐器来混合节拍,使用生成式 AI 将音乐故事带入生活。 28. 本周起,ImageFX 和 MusicFX 通过 Labs 在超过100个国家可用。

用 Gemini 应用完成更多任务的新方式

  1. 我们将 Gemini 1.5 Pro 引入 Gemini Advanced 订阅者,为他们提供100万 token 的上下文窗口和处理1500页 PDF 的能力。
  2. 这也意味着 Gemini Advanced 现在拥有任何商业可用聊天机器人中最大的上下文窗口。
  3. 我们增加了通过 Google Drive 或直接从你的设备上传文件到 Gemini Advanced 的功能。
  4. 很快,Gemini Advanced 将帮助你分析数据以发现洞察,并从上传的数据文件(如电子表格)构建图表。
  5. 对旅行者来说是个好消息:Gemini Advanced 现在有一个规划功能,超越了建议活动列表,为你创建定制的行程。
34. 还有 Gemini Advanced 订阅者的 Gemini Live,这是一个全新的、以移动为先的对话体验,使用最先进的语音技术,与 Gemini 进行更自然、直观的口头对话。 35. Gemini Live 让你可以从10种自然音色的声音中选择,你可以按照自己的节奏说话,或在回复中途打断以提出澄清问题。 36. Google Messages 中的 Gemini 现在让你可以在与朋友聊天的同一应用中与 Gemini 聊天。 37. Gemini Advanced 订阅者很快将能够创建 Gems,这是为你的任何梦想定制的 Gemini 版本。只需描述你希望你的 Gem 做什么以及如何回应,Gemini 将为你特定需求创建一个 Gem。 38. 留意更多与 Gemini 连接的 Google 工具,包括 Google Calendar、Tasks、Keep 和 Clock。

让搜索为你完成工作的更新

  1. 我们使用为 Google Search 定制的新 Gemini 模型,将 Gemini 的高级功能——如多步骤推理、规划和多模态——与我们一流的搜索系统结合在一起。
  2. 搜索中的 AI Overviews 本周将在美国向所有人推出,更多国家即将推出。
41. 多步骤推理功能很快将在美国针对英文查询的 Search Labs 中推出 AI Overviews,让你可以提出复杂问题,如“找到波士顿最好的瑜伽或普拉提工作室,并显示它们的入门优惠和从 Beacon Hill 步行时间详情”。 42. 很快,你将能够调整你的 AI Overview,选择简化语言或更详细地分解内容,特别是在你对某个主题不熟悉或试图深入了解时。 43. 搜索还将获得新的规划功能。例如,餐食和旅行规划的定制功能将在今年晚些时候在 Search Labs 中推出,之后还将扩展到派对和健身等更多类别。 44. 得益于视频理解的进步,你现在可以用视频提出问题。搜索可以处理复杂的视觉问题,为你解答,然后通过 AI Overview 提供下一步和资源。 45. 搜索中的生成式 AI 很快将为你搜索新创意时创建 AI 组织的搜索结果页面。这些 AI 组织的搜索结果页面将适用于餐饮、食谱、电影、音乐、书籍、酒店、购物等类别。

Workspace 和 Photos 中的 Gemini 模型帮助

  1. Gemini 1.5 Pro 现已在 Gmail、Docs、Drive、Slides 和 Sheets 的侧面板中通过 Workspace Labs 提供,并将于下个月向我们的 Gemini for Workspace 客户和 Google One AI Premium 订阅者推出。
  2. 你将能够使用 Gmail 的侧面板来总结电子邮件并获取最重要的细节和行动项目。
  3. 除了摘要外,Gmail 的移动应用很快将使用 Gemini 提供两个新功能:Contextual Smart Reply 和 Gmail Q&A。
  4. 未来几周,Gmail 和 Docs 中的“帮助我写作”将支持西班牙语和葡萄牙语。
  5. 今年晚些时候在 Labs 中,你可以要求 Gemini 自动在 Drive 中组织电子邮件附件,生成包含数据的表格,然后使用 Data Q&A 进行分析。
  6. Google Photos 中的一项新实验功能 Ask Photos 使查找特定回忆或回忆画廊中的信息变得更容易。该功能使用 Gemini 模型,将在未来几个月推出。
52. 你还可以使用 Ask Photos 从最近的旅行中创建亮点画廊,它甚至会为你编写个性化字幕以在社交媒体上分享。

Android 进步

  1. 从今年晚些时候的 Pixel 开始,Gemini Nano——Android 内置的设备端基础模型——将具备多模态功能。你的 Pixel 手机将更能理解上下文中的信息,如视觉、声音和口语。
  2. Talkback 是 Android 设备的一项辅助功能,通过触摸和语音反馈帮助盲人和低视力人群使用设备,得益于 Gemini Nano 的多模态功能而得到改进。
  3. 一项新的可选防诈骗保护功能将使用 Gemini Nano 的设备端 AI 以保护隐私的方式帮助检测诈骗电话。更多细节将在今年晚些时候公布。
  4. 我们宣布 Circle to Search 目前已在超过1亿台 Android 设备上可用,我们有望在年底前翻倍。
  5. 很快,你将能够在 Android 上使用 Gemini 创建并拖放生成的图像到 Gmail、Google Messages 等,或询问你正在观看的 YouTube 视频。
  6. 如果你有 Gemini Advanced,你还将有“询问此 PDF”选项,以快速获取答案而无需翻阅多页。
  7. 学生现在可以直接从选定的 Android 手机和平板电脑使用 Circle to Search 获取作业帮助。此功能由 LearnLM 提供支持,这是基于 Gemini 微调用于学习的新模型系列。
  8. 今年晚些时候,Circle to Search 将能够解决涉及符号公式、图表、图形等更复杂的问题。
61. 哦,我们还介绍了 Android 15 的第二个测试版。 62. 防盗锁使用强大的 Google AI 感知你的设备是否被抢夺,并迅速锁定你的手机信息。 63. Android 15 将推出私人空间,让你可以选择将应用保持在需要额外认证才能打开的独立空间中。 64. 如果单独的锁屏不足以保护你的私人空间,你可以完全隐藏它的存在。 65. 今年晚些时候,Google Play Protect 将使用设备端 AI 帮助发现试图隐藏其行为以进行欺诈或钓鱼的应用程序。 66. 我们为日本带来了更新的消息体验,在 Google Messages 中支持 RCS。 67. 很快在美国,你将能够创建仅包含文本的数字通行证。只需拍摄通行证(如保险卡或活动门票)的照片,即可轻松添加到你的 Google Wallet 以便快速访问。 68. 我们展示了增强现实内容将如何直接在 Google Maps 中可用,为我们与三星和 Qualcomm 合作构建的 Android 生态系统扩展现实(XR)平台奠定基础。 69. 你现在可以在配备 Google 内置系统的选定汽车上观看 Max 和 Peacock 的节目,或玩 Angry Birds 游戏。 70. 我们还将 Google Cast 带到配备 Android Automotive OS 的汽车上,从 Rivian 开始将在未来几个月推出,让你轻松从手机将视频内容投射到车内。 71. 今年晚些时候,Wear OS 5 的手表将迎来电池寿命优化。例如,与 Wear OS 4 的手表相比,户外马拉松将消耗高达20%的电量。 72. Wear OS 5 还将为健身应用提供支持更多数据类型的选项,如地面接触时间、步幅长度和垂直振荡。 73. 借助我们的 Gemini 模型,Google TV 和其他 Android TV OS 设备现在更容易选择观看内容,提供个性化的 AI 生成描述。 74. 这些 AI 生成的描述还将填补电影和节目的缺失或未翻译的描述。 75. 这是一个有趣的数据:自推出以来,人们已经建立了超过10亿次 Fast Pair 连接。 76. 本月晚些时候,你将能够使用 Fast Pair 通过 Chipolo 和 PebbleBee 的蓝牙追踪器标签(未来会有更多合作伙伴)在 Find My Device 应用中连接和查找钥匙、钱包或行李等物品。

开发者进展

  1. 你可以加入 Gemini API 开发者竞赛,参与发现最有帮助和突破性的 AI 应用。奖品?一辆电改装的定制1981年 DeLorean。
  2. 我们介绍了 PaliGemma,这是我们首个针对视觉问答和图像字幕优化的视觉-语言开源模型。
  3. 我们预览了 Gemma 的下一个版本,Gemma 2。它基于全新架构构建,将包括一个更大的27B参数实例,性能超过两倍于其大小的模型,并可在单个 TPU 主机上运行。
80. Gemini 模型现可帮助开发者在 Android Studio、IDX、Firebase、Colab、VSCode、Cloud 和 IntelliJ 中提高生产力。 81. Gemini 1.5 Pro 将于今年晚些时候进入 Android Studio。凭借大上下文窗口,该模型带来更高质量的响应,并解锁多模态输入等用例。 82. Google AI Studio 现已在包括英国和欧盟在内的200多个国家可用。 83. Gemini API 现支持并行函数调用和视频帧提取。 84. 下个月,Gemini API 中的新上下文缓存功能将使你能够通过缓存常用上下文文件以较低成本优化大型提示的工作流程。 85. Android 现在为 Kotlin 多平台提供一流支持,帮助开发者跨平台共享应用的业务逻辑。 86. 可调整大小的模拟器、Compose UI 检查模式和由 Firebase 提供支持的 Android 设备流式传输是帮助开发者为所有设备形态构建的新产品。 87. 从 Chrome 126 开始,Gemini Nano 将内置于 Chrome 桌面客户端中。 88. 多页面应用的 View Transitions API,这是一个备受请求的功能,现已可用,开发者可以轻松构建平滑、流畅的类应用导航,无论网站架构如何。 89. Project IDX,我们为全栈、多平台应用打造的新集成开发者体验,现已向所有人开放试用。 90. Firebase 发布了 beta 版的 Firebase Genkit,这将使开发者更轻松地将生成式 AI 体验构建到他们的应用中。 91. Firebase 还发布了 Firebase Data Connect,这是开发者在 Firebase(通过 Google Cloud SQL)中使用 SQL 的新方式。这不仅将 SQL 工作流程带入 Firebase,还将减少开发者需要编写的应用代码量。 92. 我们与 James Manyika、Jeff Dean 和 Koray Kavukcuoglu 深入探讨了推动我们 AI 的技术和研究。

负责任的 AI 进展

  1. 我们正在通过一种我们称为“AI 辅助红队测试”的新技术增强红队测试——一种我们主动测试系统弱点并尝试打破它们的成熟实践。
  2. 我们还将 SynthID 扩展到两种新模态:文本和视频。
  3. SynthID 文本水印将在未来几个月通过我们更新的 Responsible Generative AI 工具包开源。
  4. 我们宣布了 LearnLM,这是基于 Gemini 并为学习微调的新模型系列。LearnLM 已经为我们的产品提供了一系列功能,包括 Gemini、Search、YouTube 和 Google Classroom。
97. 我们将与哥伦比亚教师学院、亚利桑那州立大学、纽约大学 Tisch 学院和可汗学院等机构的专家合作,完善并扩展 LearnLM,超越我们的产品。 98. 我们还与 MIT RAISE 合作开发了一门在线课程,帮助教育工作者在课堂上有效使用生成式 AI。 99. 我们构建了一个名为 Illuminate 的新实验工具,使知识更易获取和消化。 100. Illuminate 可以生成由两个 AI 生成的声音组成的对话,提供研究论文关键洞察的概述。你可以今天在 labs.google 注册试用。
相关文章
Salesforce发布Slack AI数字队友对抗Microsoft Copilot Salesforce发布Slack AI数字队友对抗Microsoft Copilot Salesforce推出全新职场AI策略,在Slack对话中引入专业“数字队友”,公司于周一公布。新工具Agentforce in Slack使企业能够创建和部署任务特定AI代理,搜索职场聊天,访问公司数据,并在员工日常使用的消息平台内执行操作。“正如专业员工协作解决问题,我们的客户需要AI代理协同工作,为客户和员工解决问题,”Salesforce Slack首席产品官Rob Seaman在Ven
甲骨文400亿美元英伟达芯片投资助推德克萨斯AI数据中心 甲骨文400亿美元英伟达芯片投资助推德克萨斯AI数据中心 据《金融时报》报道,甲骨文计划投资约400亿美元购买英伟达芯片,为OpenAI在德克萨斯州开发的大型新数据中心提供动力。这是迄今为止最大的芯片收购交易之一,凸显了对AI计算资源激增的需求。该设施位于德克萨斯州阿比林,是美国首个“星门”数据中心。由OpenAI和软银支持,这是构建大规模AI基础设施的更广泛计划的一部分。该德克萨斯中心计划于明年完工,将提供1.2吉瓦的计算能力,使其跻身全球最大数据中心
Meta AI应用将引入高级订阅和广告 Meta AI应用将引入高级订阅和广告 Meta的AI应用可能很快推出付费订阅服务,效仿OpenAI、Google和Microsoft等竞争对手的做法。在2025年第一季度财报电话会议上,Meta首席执行官马克·扎克伯格概述了高级服务的计划,使用户能够访问增强的计算能力或Meta AI的额外功能。为了与ChatGPT竞争,Meta本周推出了一款独立AI应用,允许用户直接与聊天机器人互动并进行图像生成。该聊天机器人目前拥有近10亿用户,此
评论 (52)
0/200
DennisMitchell
DennisMitchell 2025-08-18 03:01:00

The I/O 2024 updates blew my mind! 😍 Those new Gemini app features are slick, but I'm really curious how devs will use those generative AI tools. Anyone else hyped to see what apps come out of this?

FredGreen
FredGreen 2025-08-10 13:00:59

I/O 2024 was a blast! The Gemini app upgrades sound slick, but I'm curious if the new AI features will actually make my life easier or just add more buzzwords to my inbox. 😎 Anyone tried them yet?

CharlesHernández
CharlesHernández 2025-04-20 13:00:11

I/O 2024 was insane! So many cool updates, especially the Gemini app enhancements. I'm super excited to try out the new generative AI features. The list of 100 announcements is a bit overwhelming, but in a good way! Can't wait to dive in! 🚀

HaroldMoore
HaroldMoore 2025-04-20 12:28:30

I/O 2024は最高でした!Geminiアプリの強化が特に気に入りました。新しい生成AIの機能も楽しみですが、開発者ツールについてもう少し詳しく知りたかったです。全部試すのが待ちきれません!😊🚀

RalphSanchez
RalphSanchez 2025-04-20 03:31:49

I/O 2024 정말 대단했어! 특히 제미니 앱의 강화가 최고야. 새로운 생성 AI 기능을 시도하는 게 너무 기대돼. 100개의 발표 목록은 조금 압도적이지만, 좋은 의미에서 그래! 빨리 써보고 싶어! 🚀

ThomasLewis
ThomasLewis 2025-04-19 14:38:18

I/O 2024は最高でした!ジェミニアプリの更新が特に気に入りました。新しい生成AI機能も試してみたいです。100の発表リストは圧倒的ですが、良い意味で!😅 早く詳しく見てみたいですね!

返回顶部
OR