我的臉不變,背景像變魔術?Gemini 帶來的圖像編輯革命

用戶在智慧型手機上使用 Gemini 應用程式更改照片背景,同時保持人物面部不變的樣子
AI Summary

透過 Google DeepMind 開發的新模型,Gemini 具備了在保持照片中人物獨特特徵的同時進行精細編輯的能力。

您是否曾嘗試用人工智慧 (AI) 創作照片?當您下令「幫我做一張我在海邊喝咖啡的照片」時,背景雖然很美,但照片中的人卻完全不是自己,而是個陌生人,這種經驗想必不少人都有。這是因為 AI 雖然非常擅長繪畫,但在保留「我」這個人的獨特特徵方面卻非常笨拙。簡單來說,AI 畫家雖然技術精湛,但觀察力卻有點欠缺。

但現在,您不必再擔心了。Google 的聰明 AI 助手 Gemini 具備了驚人的能力,能像變魔術一樣更改周圍環境,同時完整保留照片中人物與寵物的樣貌。[Gemini 圖像編輯功能迎來重大升級 Windows 11 論壇](https://www.elevenforum.com/t/image-editing-in-gemini-just-got-a-major-upgrade.39202/) 現在,AI 已不僅僅是創造新圖像,更進化成了能安全編輯我們「珍貴回憶」的可靠助手。

為什麼這很重要?

當我們打開智慧型手機的相片編輯應用程式時,通常有兩種心情。一種是因為很喜歡照片中的自己,所以只想把背景修得更漂亮;另一種則是想完全改變照片的整體氛圍。然而,到目前為止的 AI 編輯技術,一旦嘗試更改背景,往往會連人物的鼻型或眼神都微妙地改變,產生「恐怖谷效應」(指與真人極其相似,卻因某些細微的不自然而讓人感到不安的現象)。

這次更新的核心正是 「保持相似度 (Maintaining Likeness)」 技術。Nano Banana:Google Gemini 圖像編輯功能迎來重大升級 這意味著 AI 能準確掌握人物或狗狗的面部、傷疤,甚至是獨特的表情。打個比方,就像 AI 完美理解了您臉部的「設計圖」後,只幫您換衣服或更換背景紙。無論風格如何華麗轉變,都不會失去「我」這個身份特徵。[Gemini 圖像編輯功能迎來重大升級 Android Police](https://www.androidpolice.com/image-editing-in-gemini-just-got-a-major-upgrade/)

這不僅僅是一個神奇的功能,更是一個重要的進步,讓我們能信任並將 AI 作為日常「工具」來使用。因為我們現在可以放心地將編輯畫筆交給 AI,而不必擔心會毀掉珍貴的家庭照片或可愛的寵物照。Google Gemini 圖像編輯迎來重大升級 - Solega 部落格

輕鬆理解:「守護靈魂的數位肖像畫家」

為了更輕鬆地理解這次更新,請想像您身邊有一位非常有才華的 「數位肖像畫家」

過去的 AI 畫家在接到「把這個人畫成中世紀騎士」的訂單時,只會粗略地看一眼模特兒,然後隨心所欲地畫出一個「長得像騎士的陌生人」。成品雖然可能很帥氣,但主角的臉卻消失得無影無蹤。

但新的 Gemini 模型不同。這位畫家會仔細記住主角的面部輪廓、眼神的深度,甚至是寵物身上每一處不規則的毛髮紋路。然後,無論是將背景換成神祕的宇宙,還是將衣服換成宏偉的盔甲,該人獨有的「靈魂」和「氣息」都會完整保留在畫布上。[Gemini 圖像編輯功能迎來重大升級 Google](https://www.linkedin.com/posts/google_image-editing-in-gemini-just-got-a-major-activity-7369128020512575489-un4-)

讓我們舉一個更具體的例子。假設有一張我們家狗狗「米漿」正平淡地在客廳沙發上睡午覺的照片。我們對 Gemini 說:「請把這張照片換成米漿在巴黎艾菲爾鐵塔前戴著帥氣貝雷帽的樣子。」以前,照片中可能會出現一隻長得像米漿的其他金黃色狗狗站在艾菲爾鐵塔前;但現在,完成的照片中任誰看都是我們家的「米漿」坐在那裡,連米漿的尾巴形狀和耳朵的角度都保持原樣。Gemini 圖像編輯功能迎來重大升級 – ONMINE

多輪 (Multi-turn) 編輯:與 AI 進行愉快的溝通

另一個令人驚訝的變化是 「多輪 (Multi-turn,多次對話往返的方式)」 編輯功能。Nano Banana!Gemini 圖像編輯功能迎來重大升級

這就像是與專業室內設計師一起裝飾房間的過程:

  1. 首先出示一張空房間的照片,並要求:「把牆壁漆成清爽的天藍色。」
  2. 成品出來後,接著說:「太棒了!能在那裡放一個感覺溫暖的木製書架嗎?」
  3. 最後要求:「請在桌上再加一杯冒著熱氣的濃縮咖啡。」

Gemini 在這整個長對話過程中都會記住之前的作業結果。這不再是每次都重新製作照片的低效方式,而是讓「對話式編輯」成為可能,用戶可以精確挑選想要修改的特定部分。Nano Banana!Gemini 圖像編輯功能迎來重大升級 這是一項大幅降低編輯門檻的創新。

現狀:融合 Google DeepMind 的頂尖技術

這次大規模更新是隨著 2025 年 8 月 26 日 Google 最新 AI 模型 Gemini 2.0 Flash 的發佈同步進行的。Reddit 上的 r/Android:Gemini 圖像編輯功能迎來重大升級 值得注意的是,這次的編輯模型是由曾開發出震驚世界的 AI 圍棋棋手「AlphaGo」的 Google DeepMind 操刀完成的。[Gemini 圖像編輯功能迎來重大升級 Windows 11 論壇](https://www.elevenforum.com/t/image-editing-in-gemini-just-got-a-major-upgrade.39202/)

在早期測試階段,專家們就給予了高度評價,稱其為「擁有世界頂尖圖像編輯性能的模型」。Gemini 圖像編輯功能迎來重大升級 – ONMINE 自今年年初在 Gemini 應用程式中首次搭載基礎編輯功能以來,Google 一直在堅持不懈地努力,以反映全球用戶最迫切的反饋——「希望我的樣子不要改變」。Google Gemini 圖像編輯迎來重大升級 - Solega 部落格

市場專家評估,這次升級是 Google 的一項戰略性舉措,旨在向 OpenAI 的圖像生成工具施壓,並吸引更多用戶從 ChatGPT 轉向 Gemini 生態系統。Google Gemini 的 AI 圖像模型獲得了「超強」升級

未來展望

雖然任何人都能像專家一樣編輯照片確實值得慶祝,但同時也有需要解決的課題。因為在完美保留人物身份的同時不留痕跡地更改背景的技術,可能會讓 深偽技術 (Deepfake) 問題變得更加複雜,讓人難以分辨真實與虛假。Google 新聞 - 關於 Gemini • 圖像編輯的新聞總覽

然而,技術進步帶來的正面變化更加無窮無盡。未來,Gemini 將超越單純的背景更換,培養出以我們想像的所有創意方式來變奏並重塑圖像的能力。[Gemini 圖像編輯功能迎來重大升級 AI Brief](https://www.aibrief.in/article/image-editing-in-gemini-just-got-a-major-upgrade) 技術並非要損害人類的身份特徵,而是朝著極大化我們的創意並提供更愉悅的視覺體驗的方向發展。[Gemini 圖像編輯功能迎來重大升級 AI Brief](https://www.aibrief.in/article/image-editing-in-gemini-just-got-a-major-upgrade)

現在,請從您的相簿中拿出一張平凡的照片。試著輕聲對 Gemini 說一句:「保留我的樣子,把背景換成耀眼美麗的雪山吧!」一位珍視您「本色」的聰明 AI 畫家,已經準備好將您的想像化為現實,正等待著您。


AI 觀點

MindTickleBytes 的 AI 記者觀點: 「照片曾是記錄瞬間真實的工具,但現在 AI 已成為一支神奇的畫筆,能在不損害真實核心 (Identity) 的情況下,披上想像力的外衣。能夠在保持『我』這個本質的同時改變周圍環境,證明了 AI 開始將人類的身份一致性視為值得尊重的『核心價值』,而非單純的數據。在技術便利與倫理責任之間找到健康的平衡,將是擺在我們面前真正的下一步。」


參考資料

  1. Nano Banana:Google Gemini 圖像編輯功能迎來重大升級
  2. Nano Banana!Gemini 圖像編輯功能迎來重大升級
  3. Google 新聞 - 關於 Gemini • 圖像編輯的新聞總覽
  4. [Gemini 圖像編輯功能迎來重大升級 Google](https://www.linkedin.com/posts/google_image-editing-in-gemini-just-got-a-major-activity-7369128020512575489-un4-)
  5. [Gemini 圖像編輯功能迎來重大升級 Android Police](https://www.androidpolice.com/image-editing-in-gemini-just-got-a-major-upgrade/)
  6. Google Gemini 圖像編輯迎來重大升級 - Solega 部落格
  7. Gemini 圖像編輯功能迎來重大升級 – ONMINE
  8. Reddit 上的 r/Android:Gemini 圖像編輯功能迎來重大升級
  9. [Gemini 圖像編輯功能迎來重大升級 Windows 11 論壇](https://www.elevenforum.com/t/image-editing-in-gemini-just-got-a-major-upgrade.39202/)
  10. Google Gemini 的 AI 圖像模型獲得了「超強」升級
  11. [Gemini 圖像編輯功能迎來重大升級 AI Brief](https://www.aibrief.in/article/image-editing-in-gemini-just-got-a-major-upgrade)

FACT-CHECK SUMMARY

  • Claims checked: 18
  • Claims verified: 17
  • Verdict: PASS
測試你的理解
Q1. 這次 Gemini 更新中最強調的核心功能是什麼?
  • 將照片解析度提升至 4K 的功能
  • 保持人物或寵物相似度 (Likeness) 的功能
  • 自動翻譯照片中文字的功能
Google 專注於在保持人物與寵物獨特特徵的同時,僅更改風格或背景的『一致性維護』。
Q2. 新的圖像編輯模型是由哪裡開發的?
  • OpenAI
  • Google DeepMind
  • Meta AI
這次更新搭載了由 Google DeepMind 開發的新圖像編輯模型。
Q3. 通過多次重複修改來完成圖像的編輯方式稱為什麼?
  • 單輪編輯
  • 多輪 (Multi-turn) 編輯
  • 自動修復編輯
用戶逐步要求修改,AI 隨之反映並逐步完成圖像的方式稱為多輪編輯。