Gemini Nano Banana 加強企業影像編輯的一致性與控制規模 - 仍有改善空間
介紹 Gemini 2.5 Flash Image
Google 已推出 Gemini 2.5 Flash Image,之前在 beta 測試期間內部稱為「nanobanana」。這個先進的模式為企業提供更強大的創意靈活性,能以超越先前版本的精準控制能力快速轉換圖像。
該技術將以現有的 Gemini 2.5 Flash 框架為基礎,完全整合到 Gemini 應用程式生態系統中。此次更新大幅提升了平台的原生編輯功能,同時在修改後的圖像中保持一致的角色表達。舉例來說,使用者可以上傳寵物照片,並在不影響被攝物體可識別特徵的情況下,無縫調整背景或添加配件。
保持數位編輯的真實性
"Gemini 專家 David Sharon 和 Nicole Brichtova 解釋說:「我們了解編輯個人照片需要保持真實的肖像 - 近似值是不夠的。「我們的最新發展優先讓您所愛的人的外貌保持一致,無論他們是人類的家庭成員還是珍愛的寵物」。
此次更新直接解決了業界普遍存在的煩惱,即輕微的 AI 編輯請求會不慎扭曲重要的面部特徵或其他關鍵元素。

所有的輸出都將採用 Google 專屬的 SynthID 水印技術,免費與高階 Gemini 應用程式皆可使用。
社交媒體的熱烈討論
當科技愛好者在 LM Arena 測試中發現神秘的「nanobanana」模型在複雜的影像處理任務上表現優異時,各平台上的期待迅速升溫。風險投資家 Justine Moore 強調它能精準處理複雜的多步指令。
"Nano-banana "可讓您上傳兩張圖片,並提示將其合併。它能遵循複雜的多步指令,精確度令人印象深刻"。
當多位早期測試者證實與 Google 有聯繫時,這款機型的來歷就變得更清楚了,不過官方仍未正式證實。社交媒體上的範例展示了從專業肖像修改到環境轉換等各種功能。
產業競爭白熱化
這次推出的功能強化了與 Qwen-Image Edit 和 OpenAI 的 ChatGPT 圖像編輯 API 等競爭對手的競爭。傳統創意軟體大廠 Adobe 繼續將 Firefly 模型整合至 Photoshop 及其他創意套件。
進化的編輯功能
自 3 月推出原生影像編輯功能以來,Gemini 已擴充功能以協助企業簡化工作流程。該平台現在無需切換應用程式即可進行全面編輯 - 使用者可在單一介面上傳、修改,甚至將編輯好的影像編輯成視訊簡報。
除基本修改外,Gemini 2.5 Flash Image 還支援以下複雜技術:
- 無縫圖片混合
- 多步迭代編輯
- 影像間的風格轉換
- 上下文環境修改
相關文章
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
相關專題推薦
評論 (1)
0/500
介紹 Gemini 2.5 Flash Image
Google 已推出 Gemini 2.5 Flash Image,之前在 beta 測試期間內部稱為「nanobanana」。這個先進的模式為企業提供更強大的創意靈活性,能以超越先前版本的精準控制能力快速轉換圖像。
該技術將以現有的 Gemini 2.5 Flash 框架為基礎,完全整合到 Gemini 應用程式生態系統中。此次更新大幅提升了平台的原生編輯功能,同時在修改後的圖像中保持一致的角色表達。舉例來說,使用者可以上傳寵物照片,並在不影響被攝物體可識別特徵的情況下,無縫調整背景或添加配件。
保持數位編輯的真實性
"Gemini 專家 David Sharon 和 Nicole Brichtova 解釋說:「我們了解編輯個人照片需要保持真實的肖像 - 近似值是不夠的。「我們的最新發展優先讓您所愛的人的外貌保持一致,無論他們是人類的家庭成員還是珍愛的寵物」。
此次更新直接解決了業界普遍存在的煩惱,即輕微的 AI 編輯請求會不慎扭曲重要的面部特徵或其他關鍵元素。

所有的輸出都將採用 Google 專屬的 SynthID 水印技術,免費與高階 Gemini 應用程式皆可使用。
社交媒體的熱烈討論
當科技愛好者在 LM Arena 測試中發現神秘的「nanobanana」模型在複雜的影像處理任務上表現優異時,各平台上的期待迅速升溫。風險投資家 Justine Moore 強調它能精準處理複雜的多步指令。
"Nano-banana "可讓您上傳兩張圖片,並提示將其合併。它能遵循複雜的多步指令,精確度令人印象深刻"。
當多位早期測試者證實與 Google 有聯繫時,這款機型的來歷就變得更清楚了,不過官方仍未正式證實。社交媒體上的範例展示了從專業肖像修改到環境轉換等各種功能。
產業競爭白熱化
這次推出的功能強化了與 Qwen-Image Edit 和 OpenAI 的 ChatGPT 圖像編輯 API 等競爭對手的競爭。傳統創意軟體大廠 Adobe 繼續將 Firefly 模型整合至 Photoshop 及其他創意套件。
進化的編輯功能
自 3 月推出原生影像編輯功能以來,Gemini 已擴充功能以協助企業簡化工作流程。該平台現在無需切換應用程式即可進行全面編輯 - 使用者可在單一介面上傳、修改,甚至將編輯好的影像編輯成視訊簡報。
除基本修改外,Gemini 2.5 Flash Image 還支援以下複雜技術:
- 無縫圖片混合
- 多步迭代編輯
- 影像間的風格轉換
- 上下文環境修改
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似





首頁






