面容依旧,背景魔变?Gemini 带来的图像编辑革命

用户在智能手机上使用 Gemini 应用更换照片背景,同时保持人物面部不变的场景
AI Summary

通过谷歌 DeepMind 开发的新模型,Gemini 具备了在保持照片中人物固有特征的同时,进行精细编辑的能力。

你是否曾尝试用人工智能(AI)制作过照片?当你下令“帮我做一张在海边喝咖啡的照片”时,背景虽然很美,但照片里的人却完全不是你,而是一个陌生人,这种经历想必让你感到困惑。这是因为虽然 AI 画画水平极高,但在守护“我”这个人的固有特征方面却非常笨拙。简单来说,AI 画家虽然技艺精湛,但观察力却稍显不足。

不过,现在你可以放下这种担心了。谷歌聪明的 AI 助手 Gemini 现已具备一项惊人的能力:它能在完整保留照片中人物和宠物样貌的同时,像变魔术一样改变周围环境。[Image editing in Gemini just got a major upgrade Windows 11 Forum](https://www.elevenforum.com/t/image-editing-in-gemini-just-got-a-major-upgrade.39202/) 现在,AI 已不仅限于创造新图像,而是进化成了能够安全编辑我们“珍贵记忆”的可靠助手。

为什么这很重要?

当我们打开手机里的照片编辑应用时,通常有两种心态:一种是觉得自己照片里的样子很满意,只想让背景更酷一点;另一种则是想彻底改变照片的整体氛围。然而,到目前为止的 AI 编辑技术,在尝试更换背景时往往会连带着微妙地改变人物的鼻型或眼角,从而产生“恐怖谷效应”(指与真人极其相似但又由于某些不自然之处而让人感到反感的现象)。

此次更新的核心正是 “一致性维护(Maintaining Likeness)” 技术。Nano Banana: Image editing in Google Gemini gets a major upgrade 这意味着 AI 能够精准识别人物或宠物的面部、疤痕甚至是独特的表情。比喻来说,就像是 AI 在完美理解了你面部的“设计图”后,只为你更换衣服或背景板。无论风格如何华丽转变,你的身份特征绝不会丢失。[Image editing in Gemini just got a major upgrade Android Police](https://www.androidpolice.com/image-editing-in-gemini-just-got-a-major-upgrade/)

这不仅是一项新奇的功能,更是让 AI 成为我们可以信赖的日常“工具”的重要进步。因为我们终于可以放心地把编辑的画笔交给 AI,而不用担心它会毁掉珍贵的全家福或可爱的宠物照。Image editing in Google Gemini gets a major upgrade - Solega Blog

轻松理解:“守护灵魂的数字肖像画家”

为了更轻松地理解这次更新,请想象你身边有一位才华横溢的 “数字肖像画家”

以前的 AI 画家在接到“把这个人画成中世纪骑士”的订单时,只会大概扫一眼模特,然后按照自己的心意画出一个“长得像骑士的陌生人”。成品虽然可能很帅,但主人公的面影早已消失不见。

但新的 Gemini 模型不同。这位画家会仔细记住主人公的面部轮廓、眼神深度,甚至宠物身上每一处不规则的斑纹。随后,无论它是将背景换成神秘的宇宙,还是为人物穿上庄严的盔甲,那个人的“灵魂”和“氛围”都会原封不动地留在画布上。[Image editing in Gemini just got a major upgrade. Google](https://www.linkedin.com/posts/google_image-editing-in-gemini-just-got-a-major-activity-7369128020512575489-un4-)

让我们举一个更具体的例子。假设你有一张自家狗狗“小黄”在客厅沙发上睡午觉的照片。你告诉 Gemini:“把小黄换成戴着帅气贝雷帽站在巴黎埃菲尔铁塔前的样子。”以前,你可能会得到一张长得像小黄的金色狗狗站在塔前的照片,而现在,完成的作品会让任何人一看就知道那是你家的“小黄”坐在那里,连它的尾巴形状和耳朵角度都保持原样。Image editing in Gemini just got a major upgrade – ONMINE

多轮(Multi-turn)编辑:与 AI 的愉快沟通

另一个惊人的变化是 “多轮(Multi-turn)” 编辑功能。Nano Banana! Image editing in Gemini just got a major upgrade

这非常像是在和专业的室内设计师一起布置房间:

  1. 首先展示一张空房子的照片,要求“把墙刷成清凉的天蓝色”。
  2. 看到成品后,补充道:“太棒了!能在那里放一个感觉很温馨的木制书柜吗?”
  3. 最后下令:“在桌子上加一杯冒着热气的浓缩咖啡。”

Gemini 会在整个漫长的对话过程中记住之前的作业成果。它不再是那种低效地从头开始重新制作照片的方式,而是实现了“对话式编辑”,允许用户精准挑选想要修改的特定部分。Nano Banana! Image editing in Gemini just got a major upgrade 这一创新极大地降低了图片编辑的门槛。

现状:融入谷歌 DeepMind 的尖端技术力

这次大规模更新是伴随着 2025 年 8 月 26 日谷歌最新 AI 模型 Gemini 2.0 Flash 的发布同步进行的。r/Android on Reddit: Image editing in Gemini just got a major upgrade 值得注意的是,此次的编辑模型是出自曾开发出人工智能围棋手“AlphaGo”而震惊世界的 谷歌 DeepMind (Google DeepMind) 之手。[Image editing in Gemini just got a major upgrade Windows 11 Forum](https://www.elevenforum.com/t/image-editing-in-gemini-just-got-a-major-upgrade.39202/)

在早期测试阶段,它就获得了专家们“拥有全球顶级图像编辑性能的模型”的高度赞誉。Image editing in Gemini just got a major upgrade – ONMINE 谷歌自今年年初在 Gemini 应用中首次搭载基本编辑功能以来,一直致力于响应全球用户最迫切的反馈——“希望我自己的样子不要改变”。Image editing in Google Gemini gets a major upgrade - Solega Blog

市场专家认为,此次升级是谷歌为了向 OpenAI 的图像生成工具施压,并将更多用户从 ChatGPT 吸引到 Gemini 生态系统中的战略性举措。Google Gemini’s AI image model gets a ‘bananas’ upgrade

未来会如何?

虽然每个人都能像专家一样编辑照片显然是一件值得庆祝的事,但同时也存在需要解决的课题。因为能够完美保留人物身份并天衣无缝更换背景的技术,可能会让本就真假难辨的 深度伪造(Deepfake) 问题变得更加复杂。Google News - News about Gemini • image editing - Overview

然而,技术进步带来的积极变化将更加不可限量。未来,Gemini 不仅会超越简单的背景更换,还会不断提升以我们想象中的各种创意方式对图像进行变奏和重生的能力。[Image editing in Gemini just got a major upgrade AI Brief](https://www.aibrief.in/article/image-editing-in-gemini-just-got-a-major-upgrade) 这种技术并非旨在损害人类的身份特征,而是致力于最大化我们的创造力,提供更愉悦的视觉体验。[Image editing in Gemini just got a major upgrade AI Brief](https://www.aibrief.in/article/image-editing-in-gemini-just-got-a-major-upgrade)

现在,请翻出你相册里的一张普通照片。试着轻轻地对 Gemini 说一句话如何?“保留我的样子,只把背景换成绚丽壮观的雪山!”这位珍视你“自我本色”的聪明 AI 画家已经准备就绪,期待着将你的想象化为现实。


AI 视角

MindTickleBytes 的 AI 记者视角: “照片曾是记录刹那真相的工具,而现在 AI 变成了在不损害真相核心(身份)的前提下,为照片披上想象力外衣的魔法笔。能够保持‘我’的本质并改变周围环境,证明了 AI 开始将人类身份视为需要尊重的‘核心价值’,而不仅仅是简单的数字。在技术的便利性与伦理责任之间寻找健康的平衡,这才是摆在我们面前的真正下一个阶段。”


参考资料

  1. Nano Banana: Image editing in Google Gemini gets a major upgrade
  2. Nano Banana! Image editing in Gemini just got a major upgrade
  3. Google News - News about Gemini • image editing - Overview
  4. [Image editing in Gemini just got a major upgrade. Google](https://www.linkedin.com/posts/google_image-editing-in-gemini-just-got-a-major-activity-7369128020512575489-un4-)
  5. [Image editing in Gemini just got a major upgrade Android Police](https://www.androidpolice.com/image-editing-in-gemini-just-got-a-major-upgrade/)
  6. Image editing in Google Gemini gets a major upgrade - Solega Blog
  7. Image editing in Gemini just got a major upgrade – ONMINE
  8. r/Android on Reddit: Image editing in Gemini just got a major upgrade
  9. [Image editing in Gemini just got a major upgrade Windows 11 Forum](https://www.elevenforum.com/t/image-editing-in-gemini-just-got-a-major-upgrade.39202/)
  10. Google Gemini’s AI image model gets a ‘bananas’ upgrade
  11. [Image editing in Gemini just got a major upgrade AI Brief](https://www.aibrief.in/article/image-editing-in-gemini-just-got-a-major-upgrade)

事实核查摘要

  • 核查项:18
  • 已证实:17
  • 结论:通过 (PASS)
测试你的理解
Q1. 这次 Gemini 更新中最强调的核心功能是什么?
  • 将照片分辨率提升至 4K 的功能
  • 保持人物或宠物样貌(Likeness)一致性的功能
  • 自动翻译照片中文字的功能
谷歌专注于在改变风格或背景的同时,保持人物和宠物固有特征的‘一致性维护’。
Q2. 新的图像编辑模型是由哪里开发的?
  • OpenAI
  • 谷歌 DeepMind (Google DeepMind)
  • Meta AI
此次更新搭载了由谷歌 DeepMind 开发的新型图像编辑模型。
Q3. 通过多次反复修改来完成图像的编辑方式称为什么?
  • 单轮编辑
  • 多轮(Multi-turn)编辑
  • 自动修复编辑
用户逐步提出修改要求,AI 随之响应并逐渐完善图像的方式称为多轮编辑。