Gemini Nano Banana 增强了企业图像编辑的一致性和规模控制 - 仍有改进空间
双子座 2.5 闪存图像介绍
谷歌推出了 Gemini 2.5 Flash Image,之前在测试阶段内部称为 "nanobanana"。这种先进的模式为企业提供了更大的创意灵活性,实现了图像的快速转换,其精确控制能力超过了以前的版本。
该技术将在现有 Gemini 2.5 Flash 框架的基础上,完全集成到 Gemini 应用程序生态系统中。此次更新大大增强了平台的本地编辑功能,同时在修改后的图像中保持了一致的字符表现形式。例如,用户可以上传宠物照片,然后无缝调整背景或添加配件,而不会影响主体的可识别特征。
在数字编辑中保持真实性
"我们知道,编辑个人照片需要保持真实的肖像--近似是不够的,"Gemini 专家 David Sharon 和 Nicole Brichtova 解释说。"我们的最新进展优先考虑保持您所爱的人的外观一致,无论他们是人类家庭成员还是珍爱的宠物。
此次更新直接解决了业界普遍存在的一个问题,即人工智能的小规模编辑请求会无意中扭曲重要的面部特征或其他关键元素。

所有输出都将采用谷歌专有的 SynthID 水印技术,免费和高级 Gemini 应用程序均可使用。
社交媒体的热议
在 LM Arena 测试中,一个神秘的 "纳米香蕉 "模型在复杂的图像处理任务中表现出色。风险投资家贾斯廷-摩尔(Justine Moore)强调了它能够非常精确地处理复杂的多步骤指令。
"Nano-banana "可以让你上传两张图片,并提示将它们组合在一起。它可以准确无误地执行复杂的多步骤指令"。
当多个早期测试者确认与谷歌的联系时,该模型的起源变得更加清晰,尽管官方的确认仍在等待中。社交媒体上的例子展示了从专业肖像修改到环境改造的各种功能。
行业竞争白热化
此次发布加剧了与 Qwen-Image Edit 和 OpenAI 的 ChatGPT 图像编辑 API 等竞争对手的竞争。传统创意软件巨头 Adobe 继续在 Photoshop 和其他创意套件中整合其 Firefly 模型。
不断发展的编辑功能
自 3 月份推出原生图像编辑功能以来,Gemini 不断扩展功能,帮助企业简化工作流程。现在,该平台无需切换应用程序即可进行全面编辑--用户可以在单一界面中上传、修改甚至将编辑好的图像编译成视频演示文稿。
除基本修改外,Gemini 2.5 Flash Image 还支持复杂的技术,包括
- 无缝图片混合
- 多步骤迭代编辑
- 图像之间的风格转换
- 上下文环境修改
相关文章
Google I/O 2026 发布 Gmail 收件箱语音交互功能
谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
相关专题推荐
评论 (1)
0/500
双子座 2.5 闪存图像介绍
谷歌推出了 Gemini 2.5 Flash Image,之前在测试阶段内部称为 "nanobanana"。这种先进的模式为企业提供了更大的创意灵活性,实现了图像的快速转换,其精确控制能力超过了以前的版本。
该技术将在现有 Gemini 2.5 Flash 框架的基础上,完全集成到 Gemini 应用程序生态系统中。此次更新大大增强了平台的本地编辑功能,同时在修改后的图像中保持了一致的字符表现形式。例如,用户可以上传宠物照片,然后无缝调整背景或添加配件,而不会影响主体的可识别特征。
在数字编辑中保持真实性
"我们知道,编辑个人照片需要保持真实的肖像--近似是不够的,"Gemini 专家 David Sharon 和 Nicole Brichtova 解释说。"我们的最新进展优先考虑保持您所爱的人的外观一致,无论他们是人类家庭成员还是珍爱的宠物。
此次更新直接解决了业界普遍存在的一个问题,即人工智能的小规模编辑请求会无意中扭曲重要的面部特征或其他关键元素。

所有输出都将采用谷歌专有的 SynthID 水印技术,免费和高级 Gemini 应用程序均可使用。
社交媒体的热议
在 LM Arena 测试中,一个神秘的 "纳米香蕉 "模型在复杂的图像处理任务中表现出色。风险投资家贾斯廷-摩尔(Justine Moore)强调了它能够非常精确地处理复杂的多步骤指令。
"Nano-banana "可以让你上传两张图片,并提示将它们组合在一起。它可以准确无误地执行复杂的多步骤指令"。
当多个早期测试者确认与谷歌的联系时,该模型的起源变得更加清晰,尽管官方的确认仍在等待中。社交媒体上的例子展示了从专业肖像修改到环境改造的各种功能。
行业竞争白热化
此次发布加剧了与 Qwen-Image Edit 和 OpenAI 的 ChatGPT 图像编辑 API 等竞争对手的竞争。传统创意软件巨头 Adobe 继续在 Photoshop 和其他创意套件中整合其 Firefly 模型。
不断发展的编辑功能
自 3 月份推出原生图像编辑功能以来,Gemini 不断扩展功能,帮助企业简化工作流程。现在,该平台无需切换应用程序即可进行全面编辑--用户可以在单一界面中上传、修改甚至将编辑好的图像编译成视频演示文稿。
除基本修改外,Gemini 2.5 Flash Image 还支持复杂的技术,包括
- 无缝图片混合
- 多步骤迭代编辑
- 图像之间的风格转换
- 上下文环境修改
Google I/O 2026 发布 Gmail 收件箱语音交互功能
谷歌正持续将人工智能融入用户的收件箱。在周二举行的IO 2026开发者大会上,该公司通过对话式人工智能扩展了Gmail的“AI收件箱”功能,让用户能够针对收件箱内容提出问题,而不再仅依赖搜索关键词。据谷歌介绍,这款由Gemini AI驱动的工具名为Gmail Live,可帮助用户快速定位收件箱中被埋没的信息。图片来源:谷歌例如,您可能需要查询即将出发的航班详情、牙医预约时间、爱彼迎(Airbnb)
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟





首页






