I/O 2024的前100个公告揭示了

哇,I/O 2024 充满了激动人心的更新!无论你是热衷于最新的 Gemini 应用增强功能,渴望体验新的开发者工具,还是迫不及待想尝试最新的生成式 AI 功能,总有一款适合你。不相信我们的话?来看看我们在过去几天宣布的100件事吧。
AI时刻与模型动能
- 我们推出了 Gemini 1.5 Flash,这是一个为速度和效率设计的轻量级模型。它是API中可用的最快的 Gemini 模型。
- 我们对1.5 Pro进行了显著改进,这是我们在各种任务中表现最佳的顶级模型。
- 1.5 Pro 和 1.5 Flash 现已在 Google AI Studio 和 Vertex AI 上以100万 token 的上下文窗口进行公开预览。
- 1.5 Pro 还可以通过 Google AI Studio 和 Vertex AI 的等待列表,以200万 token 的上下文窗口供开发者使用。
与 Gemini 1.5 的200万 token 能力相比,领先基础模型的上下文长度。
- 我们分享了 Project Astra,这是我们对未来 AI 助手的愿景。
- 我们宣布了 Trillium,这是我们定制 AI 加速器的第六代,即张量处理单元(TPU)。它是有史以来性能最强的 TPU。
- 与 TPU v5e 相比,Trillium TPU 的单芯片峰值计算性能提高了4.7倍。
- 它们还是我们最具可持续性的一代:Trillium TPU 的能效比 TPU v5e 高出67%以上。
- 我们展示了 NotebookLM 的 Audio Overviews 早期原型,它使用上传的材料创建个性化的口头讨论。
- 我们宣布了与 Google Search 的 Grounding 功能,将 Gemini 模型与世界知识和最新的互联网信息连接起来,现已在 Vertex AI 上普遍可用。
- 我们在 Gemini API 和 AI Studio 中添加了音频理解功能,使 Gemini 1.5 Pro 可以处理 AI Studio 中上传的视频的图像和音频。
- 从 Pixel 开始,使用 Gemini Nano 的多模态应用将像人类一样理解世界——通过文本、视觉、声音和口语。
生成式媒体模型与实验室实验
- 我们宣布了 Imagen 3,这是我们迄今为止最高质量的图像生成模型。
- Imagen 3 能理解自然语言和提示背后的意图,结合较长提示中的小细节,生成细节惊艳、逼真的照片图像,与我们之前的模型相比,视觉伪影更少。
- Imagen 3 还是我们迄今为止在渲染文本方面表现最好的模型,这是图像生成模型的一大挑战。
- 我们将 Imagen 3 推广给 ImageFX 中的受信任测试者,你可以注册加入等待列表。
- Imagen 3 将于今年夏天在 Vertex AI 上可用。
- 我们宣布了 Veo,这是我们迄今为止最强大的视频生成模型,可以生成超过一分钟的高质量1080p分辨率视频,涵盖各种电影和视觉风格。
- 我们将把 Veo 的部分功能带到 YouTube Shorts 和其他产品中。
- 我们展示了 Veo 为艺术家带来的可能性,通过与包括唐纳德·格洛弗在内的电影制作者合作,使用 Veo 进行电影项目。
- 我们展示了 Music AI Sandbox,这是一套音乐 AI 工具,让人们可以创建新的器乐部分、在不同曲目之间转换风格等。你可以在 YouTube 上找到与 Wyclef Jean 和 Marc Rebillet 合作的新歌曲。
- 查看《无限仙境》,艺术家和 Google 创意人员微调了一个 AI 模型,以无尽地重塑《爱丽丝漫游奇境记》的视觉世界。读者可以根据每位艺术家的风格,为书中1200句话生成无限图像。
- 我们宣布了 VideoFX,这是我们最新的实验工具,使用 Google DeepMind 的生成视频模型 Veo,将创意转化为视频片段。
- VideoFX 还包括一个 Storyboard 模式,让你逐场景迭代并为最终视频添加音乐。
25. 我们为 ImageFX 添加了更多编辑控制——这是社区的首要请求——让你可以通过简单地在图像上刷动来添加、移除或更改元素。
26. ImageFX 将使用 Imagen 3 解锁更多真实感,带来更丰富的细节、更少的视觉伪影和更准确的文本渲染。
27. MusicFX 现在有了“DJ模式”,帮助你通过结合流派和乐器来混合节拍,使用生成式 AI 将音乐故事带入生活。
28. 本周起,ImageFX 和 MusicFX 通过 Labs 在超过100个国家可用。
用 Gemini 应用完成更多任务的新方式
- 我们将 Gemini 1.5 Pro 引入 Gemini Advanced 订阅者,为他们提供100万 token 的上下文窗口和处理1500页 PDF 的能力。
- 这也意味着 Gemini Advanced 现在拥有任何商业可用聊天机器人中最大的上下文窗口。
- 我们增加了通过 Google Drive 或直接从你的设备上传文件到 Gemini Advanced 的功能。
- 很快,Gemini Advanced 将帮助你分析数据以发现洞察,并从上传的数据文件(如电子表格)构建图表。
- 对旅行者来说是个好消息:Gemini Advanced 现在有一个规划功能,超越了建议活动列表,为你创建定制的行程。
34. 还有 Gemini Advanced 订阅者的 Gemini Live,这是一个全新的、以移动为先的对话体验,使用最先进的语音技术,与 Gemini 进行更自然、直观的口头对话。
35. Gemini Live 让你可以从10种自然音色的声音中选择,你可以按照自己的节奏说话,或在回复中途打断以提出澄清问题。
36. Google Messages 中的 Gemini 现在让你可以在与朋友聊天的同一应用中与 Gemini 聊天。
37. Gemini Advanced 订阅者很快将能够创建 Gems,这是为你的任何梦想定制的 Gemini 版本。只需描述你希望你的 Gem 做什么以及如何回应,Gemini 将为你特定需求创建一个 Gem。
38. 留意更多与 Gemini 连接的 Google 工具,包括 Google Calendar、Tasks、Keep 和 Clock。
让搜索为你完成工作的更新
- 我们使用为 Google Search 定制的新 Gemini 模型,将 Gemini 的高级功能——如多步骤推理、规划和多模态——与我们一流的搜索系统结合在一起。
- 搜索中的 AI Overviews 本周将在美国向所有人推出,更多国家即将推出。
41. 多步骤推理功能很快将在美国针对英文查询的 Search Labs 中推出 AI Overviews,让你可以提出复杂问题,如“找到波士顿最好的瑜伽或普拉提工作室,并显示它们的入门优惠和从 Beacon Hill 步行时间详情”。
42. 很快,你将能够调整你的 AI Overview,选择简化语言或更详细地分解内容,特别是在你对某个主题不熟悉或试图深入了解时。
43. 搜索还将获得新的规划功能。例如,餐食和旅行规划的定制功能将在今年晚些时候在 Search Labs 中推出,之后还将扩展到派对和健身等更多类别。
44. 得益于视频理解的进步,你现在可以用视频提出问题。搜索可以处理复杂的视觉问题,为你解答,然后通过 AI Overview 提供下一步和资源。
45. 搜索中的生成式 AI 很快将为你搜索新创意时创建 AI 组织的搜索结果页面。这些 AI 组织的搜索结果页面将适用于餐饮、食谱、电影、音乐、书籍、酒店、购物等类别。
Workspace 和 Photos 中的 Gemini 模型帮助
- Gemini 1.5 Pro 现已在 Gmail、Docs、Drive、Slides 和 Sheets 的侧面板中通过 Workspace Labs 提供,并将于下个月向我们的 Gemini for Workspace 客户和 Google One AI Premium 订阅者推出。
- 你将能够使用 Gmail 的侧面板来总结电子邮件并获取最重要的细节和行动项目。
- 除了摘要外,Gmail 的移动应用很快将使用 Gemini 提供两个新功能:Contextual Smart Reply 和 Gmail Q&A。
- 未来几周,Gmail 和 Docs 中的“帮助我写作”将支持西班牙语和葡萄牙语。
- 今年晚些时候在 Labs 中,你可以要求 Gemini 自动在 Drive 中组织电子邮件附件,生成包含数据的表格,然后使用 Data Q&A 进行分析。
- Google Photos 中的一项新实验功能 Ask Photos 使查找特定回忆或回忆画廊中的信息变得更容易。该功能使用 Gemini 模型,将在未来几个月推出。
52. 你还可以使用 Ask Photos 从最近的旅行中创建亮点画廊,它甚至会为你编写个性化字幕以在社交媒体上分享。
Android 进步
- 从今年晚些时候的 Pixel 开始,Gemini Nano——Android 内置的设备端基础模型——将具备多模态功能。你的 Pixel 手机将更能理解上下文中的信息,如视觉、声音和口语。
- Talkback 是 Android 设备的一项辅助功能,通过触摸和语音反馈帮助盲人和低视力人群使用设备,得益于 Gemini Nano 的多模态功能而得到改进。
- 一项新的可选防诈骗保护功能将使用 Gemini Nano 的设备端 AI 以保护隐私的方式帮助检测诈骗电话。更多细节将在今年晚些时候公布。
- 我们宣布 Circle to Search 目前已在超过1亿台 Android 设备上可用,我们有望在年底前翻倍。
- 很快,你将能够在 Android 上使用 Gemini 创建并拖放生成的图像到 Gmail、Google Messages 等,或询问你正在观看的 YouTube 视频。
- 如果你有 Gemini Advanced,你还将有“询问此 PDF”选项,以快速获取答案而无需翻阅多页。
- 学生现在可以直接从选定的 Android 手机和平板电脑使用 Circle to Search 获取作业帮助。此功能由 LearnLM 提供支持,这是基于 Gemini 微调用于学习的新模型系列。
- 今年晚些时候,Circle to Search 将能够解决涉及符号公式、图表、图形等更复杂的问题。
61. 哦,我们还介绍了 Android 15 的第二个测试版。
62. 防盗锁使用强大的 Google AI 感知你的设备是否被抢夺,并迅速锁定你的手机信息。
63. Android 15 将推出私人空间,让你可以选择将应用保持在需要额外认证才能打开的独立空间中。
64. 如果单独的锁屏不足以保护你的私人空间,你可以完全隐藏它的存在。
65. 今年晚些时候,Google Play Protect 将使用设备端 AI 帮助发现试图隐藏其行为以进行欺诈或钓鱼的应用程序。
66. 我们为日本带来了更新的消息体验,在 Google Messages 中支持 RCS。
67. 很快在美国,你将能够创建仅包含文本的数字通行证。只需拍摄通行证(如保险卡或活动门票)的照片,即可轻松添加到你的 Google Wallet 以便快速访问。
68. 我们展示了增强现实内容将如何直接在 Google Maps 中可用,为我们与三星和 Qualcomm 合作构建的 Android 生态系统扩展现实(XR)平台奠定基础。
69. 你现在可以在配备 Google 内置系统的选定汽车上观看 Max 和 Peacock 的节目,或玩 Angry Birds 游戏。
70. 我们还将 Google Cast 带到配备 Android Automotive OS 的汽车上,从 Rivian 开始将在未来几个月推出,让你轻松从手机将视频内容投射到车内。
71. 今年晚些时候,Wear OS 5 的手表将迎来电池寿命优化。例如,与 Wear OS 4 的手表相比,户外马拉松将消耗高达20%的电量。
72. Wear OS 5 还将为健身应用提供支持更多数据类型的选项,如地面接触时间、步幅长度和垂直振荡。
73. 借助我们的 Gemini 模型,Google TV 和其他 Android TV OS 设备现在更容易选择观看内容,提供个性化的 AI 生成描述。
74. 这些 AI 生成的描述还将填补电影和节目的缺失或未翻译的描述。
75. 这是一个有趣的数据:自推出以来,人们已经建立了超过10亿次 Fast Pair 连接。
76. 本月晚些时候,你将能够使用 Fast Pair 通过 Chipolo 和 PebbleBee 的蓝牙追踪器标签(未来会有更多合作伙伴)在 Find My Device 应用中连接和查找钥匙、钱包或行李等物品。
开发者进展
- 你可以加入 Gemini API 开发者竞赛,参与发现最有帮助和突破性的 AI 应用。奖品?一辆电改装的定制1981年 DeLorean。
- 我们介绍了 PaliGemma,这是我们首个针对视觉问答和图像字幕优化的视觉-语言开源模型。
- 我们预览了 Gemma 的下一个版本,Gemma 2。它基于全新架构构建,将包括一个更大的27B参数实例,性能超过两倍于其大小的模型,并可在单个 TPU 主机上运行。
80. Gemini 模型现可帮助开发者在 Android Studio、IDX、Firebase、Colab、VSCode、Cloud 和 IntelliJ 中提高生产力。
81. Gemini 1.5 Pro 将于今年晚些时候进入 Android Studio。凭借大上下文窗口,该模型带来更高质量的响应,并解锁多模态输入等用例。
82. Google AI Studio 现已在包括英国和欧盟在内的200多个国家可用。
83. Gemini API 现支持并行函数调用和视频帧提取。
84. 下个月,Gemini API 中的新上下文缓存功能将使你能够通过缓存常用上下文文件以较低成本优化大型提示的工作流程。
85. Android 现在为 Kotlin 多平台提供一流支持,帮助开发者跨平台共享应用的业务逻辑。
86. 可调整大小的模拟器、Compose UI 检查模式和由 Firebase 提供支持的 Android 设备流式传输是帮助开发者为所有设备形态构建的新产品。
87. 从 Chrome 126 开始,Gemini Nano 将内置于 Chrome 桌面客户端中。
88. 多页面应用的 View Transitions API,这是一个备受请求的功能,现已可用,开发者可以轻松构建平滑、流畅的类应用导航,无论网站架构如何。
89. Project IDX,我们为全栈、多平台应用打造的新集成开发者体验,现已向所有人开放试用。
90. Firebase 发布了 beta 版的 Firebase Genkit,这将使开发者更轻松地将生成式 AI 体验构建到他们的应用中。
91. Firebase 还发布了 Firebase Data Connect,这是开发者在 Firebase(通过 Google Cloud SQL)中使用 SQL 的新方式。这不仅将 SQL 工作流程带入 Firebase,还将减少开发者需要编写的应用代码量。
92. 我们与 James Manyika、Jeff Dean 和 Koray Kavukcuoglu 深入探讨了推动我们 AI 的技术和研究。
负责任的 AI 进展
- 我们正在通过一种我们称为“AI 辅助红队测试”的新技术增强红队测试——一种我们主动测试系统弱点并尝试打破它们的成熟实践。
- 我们还将 SynthID 扩展到两种新模态:文本和视频。
- SynthID 文本水印将在未来几个月通过我们更新的 Responsible Generative AI 工具包开源。
- 我们宣布了 LearnLM,这是基于 Gemini 并为学习微调的新模型系列。LearnLM 已经为我们的产品提供了一系列功能,包括 Gemini、Search、YouTube 和 Google Classroom。
97. 我们将与哥伦比亚教师学院、亚利桑那州立大学、纽约大学 Tisch 学院和可汗学院等机构的专家合作,完善并扩展 LearnLM,超越我们的产品。
98. 我们还与 MIT RAISE 合作开发了一门在线课程,帮助教育工作者在课堂上有效使用生成式 AI。
99. 我们构建了一个名为 Illuminate 的新实验工具,使知识更易获取和消化。
100. Illuminate 可以生成由两个 AI 生成的声音组成的对话,提供研究论文关键洞察的概述。你可以今天在 labs.google 注册试用。
相关文章
"Dot AI伴侣应用程序宣布关闭,停止个性化服务
Dot 是一款人工智能伴侣应用程序,旨在充当个人朋友和知己,根据其开发者周五发布的公告,Dot 将停止运营。Dot背后的初创公司New Computer在其网站上表示,该服务将持续到10月5日,以便用户有时间导出个人数据。今年早些时候,联合创始人山姆-惠特莫尔(Sam Whitmore)和前苹果设计专家杰森-袁(Jason Yuan)合作推出了这款应用程序。Dot 进入了日益受到关注的情感人工智能
Anthropic 解决了人工智能生成盗版图书的法律案件
Anthropic公司与美国作家达成了一项重要的版权纠纷解决方案,同意拟议的集体诉讼和解,避免了可能代价高昂的审判。本周二在法庭文件中提交的这份协议源于对这家人工智能公司使用盗版文学作品训练克劳德模型的指控。尽管此案源于作家安德烈娅-巴茨(Andrea Bartz)、查尔斯-格雷伯(Charles Graeber)和柯克-华莱士-约翰逊(Kirk Wallace Johnson)的指控,但和解细节
Figma 向所有用户发布人工智能驱动的应用程序生成工具
Figma Make 是今年早些时候推出的创新型提示到应用开发平台,现已正式退出测试版,并向所有用户推出。这一开创性的工具加入了人工智能编码助手的行列,如谷歌的 Gemini Code Assist 和微软的 GitHub Copilot,使创作者能够将自然语言描述转化为功能原型和应用程序,而无需传统的编程专业知识。Figma Make 最初在测试阶段只对高级 "全席 "用户开放,现在对所有账户类
评论 (52)
0/200
DennisMitchell
2025-08-18 03:01:00
The I/O 2024 updates blew my mind! 😍 Those new Gemini app features are slick, but I'm really curious how devs will use those generative AI tools. Anyone else hyped to see what apps come out of this?
0
FredGreen
2025-08-10 13:00:59
I/O 2024 was a blast! The Gemini app upgrades sound slick, but I'm curious if the new AI features will actually make my life easier or just add more buzzwords to my inbox. 😎 Anyone tried them yet?
0
CharlesHernández
2025-04-20 13:00:11
I/O 2024 was insane! So many cool updates, especially the Gemini app enhancements. I'm super excited to try out the new generative AI features. The list of 100 announcements is a bit overwhelming, but in a good way! Can't wait to dive in! 🚀
0
HaroldMoore
2025-04-20 12:28:30
I/O 2024は最高でした!Geminiアプリの強化が特に気に入りました。新しい生成AIの機能も楽しみですが、開発者ツールについてもう少し詳しく知りたかったです。全部試すのが待ちきれません!😊🚀
0
RalphSanchez
2025-04-20 03:31:49
I/O 2024 정말 대단했어! 특히 제미니 앱의 강화가 최고야. 새로운 생성 AI 기능을 시도하는 게 너무 기대돼. 100개의 발표 목록은 조금 압도적이지만, 좋은 의미에서 그래! 빨리 써보고 싶어! 🚀
0
ThomasLewis
2025-04-19 14:38:18
I/O 2024は最高でした!ジェミニアプリの更新が特に気に入りました。新しい生成AI機能も試してみたいです。100の発表リストは圧倒的ですが、良い意味で!😅 早く詳しく見てみたいですね!
0
哇,I/O 2024 充满了激动人心的更新!无论你是热衷于最新的 Gemini 应用增强功能,渴望体验新的开发者工具,还是迫不及待想尝试最新的生成式 AI 功能,总有一款适合你。不相信我们的话?来看看我们在过去几天宣布的100件事吧。
AI时刻与模型动能
- 我们推出了 Gemini 1.5 Flash,这是一个为速度和效率设计的轻量级模型。它是API中可用的最快的 Gemini 模型。
- 我们对1.5 Pro进行了显著改进,这是我们在各种任务中表现最佳的顶级模型。
- 1.5 Pro 和 1.5 Flash 现已在 Google AI Studio 和 Vertex AI 上以100万 token 的上下文窗口进行公开预览。
- 1.5 Pro 还可以通过 Google AI Studio 和 Vertex AI 的等待列表,以200万 token 的上下文窗口供开发者使用。
- 我们分享了 Project Astra,这是我们对未来 AI 助手的愿景。
- 我们宣布了 Trillium,这是我们定制 AI 加速器的第六代,即张量处理单元(TPU)。它是有史以来性能最强的 TPU。
- 与 TPU v5e 相比,Trillium TPU 的单芯片峰值计算性能提高了4.7倍。
- 它们还是我们最具可持续性的一代:Trillium TPU 的能效比 TPU v5e 高出67%以上。
- 我们展示了 NotebookLM 的 Audio Overviews 早期原型,它使用上传的材料创建个性化的口头讨论。
- 我们宣布了与 Google Search 的 Grounding 功能,将 Gemini 模型与世界知识和最新的互联网信息连接起来,现已在 Vertex AI 上普遍可用。
- 我们在 Gemini API 和 AI Studio 中添加了音频理解功能,使 Gemini 1.5 Pro 可以处理 AI Studio 中上传的视频的图像和音频。
- 从 Pixel 开始,使用 Gemini Nano 的多模态应用将像人类一样理解世界——通过文本、视觉、声音和口语。
生成式媒体模型与实验室实验
- 我们宣布了 Imagen 3,这是我们迄今为止最高质量的图像生成模型。
- Imagen 3 能理解自然语言和提示背后的意图,结合较长提示中的小细节,生成细节惊艳、逼真的照片图像,与我们之前的模型相比,视觉伪影更少。
- Imagen 3 还是我们迄今为止在渲染文本方面表现最好的模型,这是图像生成模型的一大挑战。
- 我们将 Imagen 3 推广给 ImageFX 中的受信任测试者,你可以注册加入等待列表。
- Imagen 3 将于今年夏天在 Vertex AI 上可用。
- 我们宣布了 Veo,这是我们迄今为止最强大的视频生成模型,可以生成超过一分钟的高质量1080p分辨率视频,涵盖各种电影和视觉风格。
- 我们将把 Veo 的部分功能带到 YouTube Shorts 和其他产品中。
- 我们展示了 Veo 为艺术家带来的可能性,通过与包括唐纳德·格洛弗在内的电影制作者合作,使用 Veo 进行电影项目。
- 我们展示了 Music AI Sandbox,这是一套音乐 AI 工具,让人们可以创建新的器乐部分、在不同曲目之间转换风格等。你可以在 YouTube 上找到与 Wyclef Jean 和 Marc Rebillet 合作的新歌曲。
- 查看《无限仙境》,艺术家和 Google 创意人员微调了一个 AI 模型,以无尽地重塑《爱丽丝漫游奇境记》的视觉世界。读者可以根据每位艺术家的风格,为书中1200句话生成无限图像。
- 我们宣布了 VideoFX,这是我们最新的实验工具,使用 Google DeepMind 的生成视频模型 Veo,将创意转化为视频片段。
- VideoFX 还包括一个 Storyboard 模式,让你逐场景迭代并为最终视频添加音乐。
用 Gemini 应用完成更多任务的新方式
- 我们将 Gemini 1.5 Pro 引入 Gemini Advanced 订阅者,为他们提供100万 token 的上下文窗口和处理1500页 PDF 的能力。
- 这也意味着 Gemini Advanced 现在拥有任何商业可用聊天机器人中最大的上下文窗口。
- 我们增加了通过 Google Drive 或直接从你的设备上传文件到 Gemini Advanced 的功能。
- 很快,Gemini Advanced 将帮助你分析数据以发现洞察,并从上传的数据文件(如电子表格)构建图表。
- 对旅行者来说是个好消息:Gemini Advanced 现在有一个规划功能,超越了建议活动列表,为你创建定制的行程。
让搜索为你完成工作的更新
- 我们使用为 Google Search 定制的新 Gemini 模型,将 Gemini 的高级功能——如多步骤推理、规划和多模态——与我们一流的搜索系统结合在一起。
- 搜索中的 AI Overviews 本周将在美国向所有人推出,更多国家即将推出。
Workspace 和 Photos 中的 Gemini 模型帮助
- Gemini 1.5 Pro 现已在 Gmail、Docs、Drive、Slides 和 Sheets 的侧面板中通过 Workspace Labs 提供,并将于下个月向我们的 Gemini for Workspace 客户和 Google One AI Premium 订阅者推出。
- 你将能够使用 Gmail 的侧面板来总结电子邮件并获取最重要的细节和行动项目。
- 除了摘要外,Gmail 的移动应用很快将使用 Gemini 提供两个新功能:Contextual Smart Reply 和 Gmail Q&A。
- 未来几周,Gmail 和 Docs 中的“帮助我写作”将支持西班牙语和葡萄牙语。
- 今年晚些时候在 Labs 中,你可以要求 Gemini 自动在 Drive 中组织电子邮件附件,生成包含数据的表格,然后使用 Data Q&A 进行分析。
- Google Photos 中的一项新实验功能 Ask Photos 使查找特定回忆或回忆画廊中的信息变得更容易。该功能使用 Gemini 模型,将在未来几个月推出。
Android 进步
- 从今年晚些时候的 Pixel 开始,Gemini Nano——Android 内置的设备端基础模型——将具备多模态功能。你的 Pixel 手机将更能理解上下文中的信息,如视觉、声音和口语。
- Talkback 是 Android 设备的一项辅助功能,通过触摸和语音反馈帮助盲人和低视力人群使用设备,得益于 Gemini Nano 的多模态功能而得到改进。
- 一项新的可选防诈骗保护功能将使用 Gemini Nano 的设备端 AI 以保护隐私的方式帮助检测诈骗电话。更多细节将在今年晚些时候公布。
- 我们宣布 Circle to Search 目前已在超过1亿台 Android 设备上可用,我们有望在年底前翻倍。
- 很快,你将能够在 Android 上使用 Gemini 创建并拖放生成的图像到 Gmail、Google Messages 等,或询问你正在观看的 YouTube 视频。
- 如果你有 Gemini Advanced,你还将有“询问此 PDF”选项,以快速获取答案而无需翻阅多页。
- 学生现在可以直接从选定的 Android 手机和平板电脑使用 Circle to Search 获取作业帮助。此功能由 LearnLM 提供支持,这是基于 Gemini 微调用于学习的新模型系列。
- 今年晚些时候,Circle to Search 将能够解决涉及符号公式、图表、图形等更复杂的问题。
开发者进展
- 你可以加入 Gemini API 开发者竞赛,参与发现最有帮助和突破性的 AI 应用。奖品?一辆电改装的定制1981年 DeLorean。
- 我们介绍了 PaliGemma,这是我们首个针对视觉问答和图像字幕优化的视觉-语言开源模型。
- 我们预览了 Gemma 的下一个版本,Gemma 2。它基于全新架构构建,将包括一个更大的27B参数实例,性能超过两倍于其大小的模型,并可在单个 TPU 主机上运行。
负责任的 AI 进展
- 我们正在通过一种我们称为“AI 辅助红队测试”的新技术增强红队测试——一种我们主动测试系统弱点并尝试打破它们的成熟实践。
- 我们还将 SynthID 扩展到两种新模态:文本和视频。
- SynthID 文本水印将在未来几个月通过我们更新的 Responsible Generative AI 工具包开源。
- 我们宣布了 LearnLM,这是基于 Gemini 并为学习微调的新模型系列。LearnLM 已经为我们的产品提供了一系列功能,包括 Gemini、Search、YouTube 和 Google Classroom。



The I/O 2024 updates blew my mind! 😍 Those new Gemini app features are slick, but I'm really curious how devs will use those generative AI tools. Anyone else hyped to see what apps come out of this?




I/O 2024 was a blast! The Gemini app upgrades sound slick, but I'm curious if the new AI features will actually make my life easier or just add more buzzwords to my inbox. 😎 Anyone tried them yet?




I/O 2024 was insane! So many cool updates, especially the Gemini app enhancements. I'm super excited to try out the new generative AI features. The list of 100 announcements is a bit overwhelming, but in a good way! Can't wait to dive in! 🚀




I/O 2024は最高でした!Geminiアプリの強化が特に気に入りました。新しい生成AIの機能も楽しみですが、開発者ツールについてもう少し詳しく知りたかったです。全部試すのが待ちきれません!😊🚀




I/O 2024 정말 대단했어! 특히 제미니 앱의 강화가 최고야. 새로운 생성 AI 기능을 시도하는 게 너무 기대돼. 100개의 발표 목록은 조금 압도적이지만, 좋은 의미에서 그래! 빨리 써보고 싶어! 🚀




I/O 2024は最高でした!ジェミニアプリの更新が特に気に入りました。新しい生成AI機能も試してみたいです。100の発表リストは圧倒的ですが、良い意味で!😅 早く詳しく見てみたいですね!












