选项
首页
新闻
Gemini Nano Banana 增强了企业图像编辑的一致性和规模控制 - 仍有改进空间

Gemini Nano Banana 增强了企业图像编辑的一致性和规模控制 - 仍有改进空间

2025-10-21
3

双子座 2.5 闪存图像介绍

谷歌推出了 Gemini 2.5 Flash Image,之前在测试阶段内部称为 "nanobanana"。这种先进的模式为企业提供了更大的创意灵活性,实现了图像的快速转换,其精确控制能力超过了以前的版本。

该技术将在现有 Gemini 2.5 Flash 框架的基础上,完全集成到 Gemini 应用程序生态系统中。此次更新大大增强了平台的本地编辑功能,同时在修改后的图像中保持了一致的字符表现形式。例如,用户可以上传宠物照片,然后无缝调整背景或添加配件,而不会影响主体的可识别特征。

在数字编辑中保持真实性

"我们知道,编辑个人照片需要保持真实的肖像--近似是不够的,"Gemini 专家 David Sharon 和 Nicole Brichtova 解释说。"我们的最新进展优先考虑保持您所爱的人的外观一致,无论他们是人类家庭成员还是珍爱的宠物。

此次更新直接解决了业界普遍存在的一个问题,即人工智能的小规模编辑请求会无意中扭曲重要的面部特征或其他关键元素。

所有输出都将采用谷歌专有的 SynthID 水印技术,免费和高级 Gemini 应用程序均可使用。

社交媒体的热议

在 LM Arena 测试中,一个神秘的 "纳米香蕉 "模型在复杂的图像处理任务中表现出色。风险投资家贾斯廷-摩尔(Justine Moore)强调了它能够非常精确地处理复杂的多步骤指令。

"Nano-banana "可以让你上传两张图片,并提示将它们组合在一起。它可以准确无误地执行复杂的多步骤指令"。

当多个早期测试者确认与谷歌的联系时,该模型的起源变得更加清晰,尽管官方的确认仍在等待中。社交媒体上的例子展示了从专业肖像修改到环境改造的各种功能。

行业竞争白热化

此次发布加剧了与 Qwen-Image Edit 和 OpenAI 的 ChatGPT 图像编辑 API 等竞争对手的竞争。传统创意软件巨头 Adobe 继续在 Photoshop 和其他创意套件中整合其 Firefly 模型。

不断发展的编辑功能

自 3 月份推出原生图像编辑功能以来,Gemini 不断扩展功能,帮助企业简化工作流程。现在,该平台无需切换应用程序即可进行全面编辑--用户可以在单一界面中上传、修改甚至将编辑好的图像编译成视频演示文稿。

除基本修改外,Gemini 2.5 Flash Image 还支持复杂的技术,包括

  • 无缝图片混合
  • 多步骤迭代编辑
  • 图像之间的风格转换
  • 上下文环境修改
相关文章
谷歌将 NotebookLM 人工智能的使用范围扩大到 18 岁以下学生 谷歌将 NotebookLM 人工智能的使用范围扩大到 18 岁以下学生 谷歌发布了其教室平台的重大升级,为教育工作者推出了免费的双子座人工智能工具,并扩大了 18 岁以下学生对 NotebookLM 的访问权限,这标志着这些工具首次面向年轻用户。使用谷歌工作空间(Google Workspace)的教育工作者可以在 "教室 "中找到一个新的 "双子座 "选项卡,该选项卡为创建教案、生成数学问题和撰写专业通讯提供人工智能辅助。Education Plus 用户还可获得更
谷歌否认人工智能搜索损害网络完整性 谷歌否认人工智能搜索损害网络完整性 谷歌在流量问题上为人工智能搜索功能辩护尽管有报道称谷歌的人工智能搜索增强功能并未对网站的整体流量产生负面影响,但谷歌仍坚称这一点。谷歌搜索部门主管莉兹-里德(Liz Reid)在最近的一篇公司博文中解释说,点击量显示出同比的稳定性,不过她也承认某些类型的在线内容偏好模式正在发生变化。这一辩解是在皮尤研究公司(Pew Research)发布研究结果后不久作出的,该研究结果表明,当搜索结果顶部出现人工
Gmail 推出人工智能驱动的自动电子邮件摘要 Gmail 推出人工智能驱动的自动电子邮件摘要 工作区用户将使用双子座邮件摘要功能随着 Gmail 开始为复杂的电子邮件线程自动生成摘要,Gemini 在管理收件箱方面的作用将得到增强。这些人工智能生成的摘要现在会直接显示在邮件内容上方,无需用户启动。虽然谷歌去年首次推出了人工智能生成的电子邮件摘要,但该功能以前需要手动激活。升级后的实现采用了人工智能,可以智能地判断摘要何时对用户有益,尤其是对于 "较长的电子邮件线程或有多个回复的邮件
评论 (0)
0/200
返回顶部
OR