选项
首页
新闻
“ 8种新的AI产品和更新测试”

“ 8种新的AI产品和更新测试”

2025-04-10
138

“ 8种新的AI产品和更新测试”

在 I/O 大会上,我们不仅仅是发布一系列更新,如新的 Gemini 模型、AI 代理和 Android 调整,我们实际上还让开发者、记者和合作伙伴通过亲手体验产品演示来深入参与。今年,我在 Shoreline 露天剧场度过了一天,那里是 I/O 大会的举办地,我体验了许多这样的演示。以下是其中几个的简要介绍。

我当天的第一个演示非常酷。我看到 Gemini Advanced 处理了一份超过 20 页的物业租赁合同,里面全是法律术语和复杂的条款。在它处理完文档后,我可以提出问题,比如房东是否允许我养宠物狗,或者是否有额外的费用需要支付。我已经期待用这个功能来理解我下次续租公寓时的租赁合同。

接下来,演示变得更加令人印象深刻。两位 Googler 向 Gemini 输入了一本数百页的经济学教科书的 PDF。我需要花很长时间才能读完,但 Gemini 迅速生成了一份总结,并指出了需要学习的关键主题。它甚至还制作了一份多选题测验,包含一个正确答案和三个狡猾的错误答案,帮助我准备一个假设的考试。

Googler Sid Lall(左)和 Adam Kurzrok(右)展示 Gemini Advanced 如何总结一本厚重的经济学教科书或数千页的文档。

这两个演示都使用了 Gemini 1.5 Pro,这是我们今年早些时候推出的、拥有任何大规模基础模型中最长上下文窗口的模型。我们现在为 Gemini Advanced 订阅者推出 Gemini 1.5 Pro 的早期访问权限,让他们可以直接从 Drive 上传文档。这意味着他们可以使用 Gemini 总结或分析长达 1500 页的文档。

Gemini 1.5 Pro 还被集成到 Workspace 应用(如 Gmail、Docs、Sheets、Slides 和 Drive)的侧边栏中。我通过在 Gmail 中使用 Gemini 总结了一封样本周报邮件,亲眼见证了它的表现,它提取了具体细节,如七年级学生的活动和过夜旅行的打包清单。

Gemini 的侧边栏可以帮助您回答 Gmail、Drive 等内容中的关键问题。

改进的长上下文窗口甚至可以在响应单个提示时从多个文档中提取信息。在 Docs 中,我请求帮助撰写一封给潜在求职者的样本信,链接到 Drive 中的职位描述文档和申请者的 PDF 作品集。Gemini 立即起草了一封考虑了两个文档细节的邮件。

但 Gemini 1.5 Pro 并不是唯一的新成员。我还体验了新发布的 Imagen 3,这是我们迄今最好的文本到图像模型。我尝试的一个酷功能是它生成装饰性文本和字母的能力。我要求生成一个风格化的字母表,比如用果酱涂在吐司上的字母或漂浮在天空中的银色气球字母。Imagen 3 生成了一整套字母表,我可以用它们创建自己的(美味)菜单。

在玩完 Imagen 3 后,我又回到了更多的 Gemini 演示。一个演示让我在 Android 手机上调出 Gemini 的覆盖层,询问屏幕上的任何内容。这展示了我们不仅扩展了 Gemini 可以回答的内容,还使其具有上下文感知能力,预测您的需求并提供有用的建议。

这个演示以一份冗长的烤箱手册为例。我没有费力阅读文档,而是调出 Gemini,立即得到了“询问此 PDF”的建议。我问了像“如何更新时钟”这样的问题,得到了快速准确的回答。它在 YouTube 视频上也同样好用。我没有看完一个 20 分钟的锻炼视频,而是询问如何修改平板支撑,立即得到了答案,然后继续下一个演示。

下一个演示介绍了新的对话模式 Gemini Live,您可以在应用中无需打字即可与 Gemini 交谈。与 Gemini 交谈的感觉与通常的聊天机器人界面不同。它的回答更具对话性,不仅仅是段落文本或项目符号列表。在我的演示中,我请求了一份暑假儿童活动清单,并能在列出清单时打断,询问更多关于扎染衬衫所需材料的信息。

Project Astra 演示将事情提升到了一个新水平,展示了我们对话 AI 项目的未来方向。

我们的 AI 沙盒,开发者与参会者在此体验了 Project Astra 等演示和其他创意 AI 实验,如 MusicFX 的 DJ 模式。

不仅仅局限于屏幕上的内容或您输入到聊天框的内容,Astra 的多模态能力可以同时理解对话语音提示和实时视频输入,开启了新型的 AI 体验。

Astra 的头韵演示从简单开始:我向摄像头展示一个物体,如香蕉或一块面包,Gemini 会想出一句头韵句。当我添加更多物体时,Gemini 保持对话流畅,从单一水果的“明亮的香蕉在板上美丽地晒太阳”到面对整个自助餐板的“烹饪创作引人注目”。

Astra 与香蕉、长棍面包……以及您能展示的任何东西进行头韵创作。

另一个 Astra 演示让我与 Gemini 玩起了 Pictionary。这听起来简单,但需要代理理解图像,记住每轮绘图内容,并使用常识猜测我在画什么。在一个演示中,Astra 知道一个圆圈不足以做出猜测,但当我在下面添加线条时,它很快从识别一个火柴人到认出一个人举着骷髅表情符号是哈姆雷特。

Astra 在 Pictionary 中未尝败绩。

在 AI 沙盒和其他演示站点的体验就像窥见了未来。这也有点让人谦卑:Astra 在多轮 Pictionary 中击败了我!

相关文章
Midjourney 推出用于创意内容的尖端人工智能视频生成器 Midjourney 推出用于创意内容的尖端人工智能视频生成器 Midjourney 的人工智能视频生成技术取得突破性进展Midjourney 发布了其首款人工智能视频生成工具,标志着其在著名的图像创建功能之外的重大扩展。最初的版本使用户能够将上传的图片和平台生成的作品转换成简短的 5 秒钟动画短片,并计划在未来进行增强。核心特点和功能直观的 "动画 "按钮,可将静态图像转换为动态图像根据文本提示生成 5 秒钟的基本视频通过手动提示编辑进行自定义动作控制视频扩
特朗普优先考虑人工智能发展而非监管,力争超越中国 特朗普优先考虑人工智能发展而非监管,力争超越中国 特朗普政府周三公布了具有里程碑意义的《人工智能行动计划》,标志着与拜登政府规避风险的人工智能政策的决裂。这份雄心勃勃的蓝图将积极的基础设施建设、全面的监管改革、强化的国家安全措施以及与中国在人工智能领域的战略竞争列为优先事项。这一政策转变可能会对经济和社会产生广泛影响,尤其是在能源使用和环境监管方面。政府建议扩大数据中心的建设,包括在联邦土地上的建设,同时可能在能源需求高峰期放宽对环境的保护--这
YouTube 将 Veo 3 人工智能视频工具直接整合到短片平台中 YouTube 将 Veo 3 人工智能视频工具直接整合到短片平台中 今年夏天,YouTube 短片将采用 Veo 3 人工智能视频模式YouTube 首席执行官尼尔-莫汉(Neal Mohan)在戛纳国际电影节主题演讲中透露,该平台最先进的 Veo 3 人工智能视频生成技术将于今年夏天晚些时候在 YouTube Shorts 上首次亮相。此前,艾利森-约翰逊(Allison Johnson)在评论中将 Veo 3 描述为人工智能辅助内容创作的革命。目前,短片创作者
评论 (36)
0/200
WillWalker
WillWalker 2025-07-31 09:41:20

Whoa, hands-on demos at I/O sound epic! Tried any cool AI agents yet? Bet they’re game-changers for devs! 😎

JeffreyThomas
JeffreyThomas 2025-04-21 09:33:38

¡Las demostraciones prácticas en I/O fueron una pasada! Pude probar los nuevos modelos Gemini y agentes de IA, que fueron bastante geniales pero un poco llenos de errores. Los ajustes de Android fueron un buen toque, sin embargo. En general, un día divertido en el Shoreline Amphitheatre, pero necesitan solucionar esos errores! 🤓

GregoryRodriguez
GregoryRodriguez 2025-04-20 00:24:35

I/O's hands-on approach with new AI products is awesome! Got to play around with the Gemini models and AI agents at Shoreline Amphitheatre. It's super engaging and you really get a feel for what's coming next. Only wish there was more time to explore everything! 🤓

ThomasYoung
ThomasYoung 2025-04-18 19:13:01

Os demos práticos no I/O foram incríveis! Consegui experimentar os novos modelos Gemini e agentes de IA, que foram bem legais, mas um pouco cheios de bugs. As melhorias no Android foram um toque agradável, no entanto. No geral, um dia divertido no Shoreline Amphitheatre, mas eles precisam corrigir esses bugs! 🤓

BrianThomas
BrianThomas 2025-04-18 12:37:15

A abordagem prática do I/O com novos produtos de IA é incrível! Pude brincar com os modelos Gemini e agentes de IA no Shoreline Amphitheatre. É super envolvente e você realmente sente o que está por vir. Só queria ter mais tempo para explorar tudo! 😎

JackMartin
JackMartin 2025-04-16 09:18:17

I/Oでの新しいAI製品の体験は最高です!ジェミニモデルやAIエージェントをショアライン円形劇場で試せました。とても楽しく、次に何が来るのかを実感できます。もっと時間があれば全部を探検したいですね!😊

返回顶部
OR