我家的机器人开始变得'懂事'了?谷歌 DeepMind 发布 Gemini Robotics ER 1.6

智能机器人正在工业现场执行精密操作并读取测量仪表
AI Summary

谷歌 DeepMind 推出了升级版大脑 Gemini Robotics ER 1.6,为机器人赋予了'常识'和'推理能力',登上了机器人技术的又一高峰。

如果机器人有了’常识’,会发生什么?

想象一下。 你拜托机器人说:“去厨房帮我拿杯水。”机器人走进厨房,发现水杯前有一滩洒掉的牛奶。如果是传统的机器人会怎样?它可能会机械地按照预设地图移动,结果踩到牛奶滑倒,或者完全意识不到需要清理牛奶,只是拿着水杯回到客厅。这显得非常缺乏灵活性。

但现在,机器人开始变得“懂事”了。谷歌 DeepMind (Google DeepMind) 最近发布的 Gemini Robotics ER 1.6 是一款赋予机器人某种“常识”的新型人工智能大脑,即具身推理 (Embodied Reasoning,指机器人在物理环境中自主进行逻辑思考和判断) Gemini Robotics ER 1.6: Enhanced Embodied Reasoning。得益于这项技术,机器人不再只是无限重复预设动作的机器,而是进化成了能够理解周围复杂且不可预测的世界,并能自主制定最佳计划的聪明存在 Gemini Robotics-ER 1.6 - The Keyword

为什么这很重要?

到目前为止,我们看到的机器人大多依赖于“预设规则”或“预编程指令”。最典型的例子就是汽车工厂流水线上分毫不差地重复焊接动作的机械臂。但我们生活的日常空间并不像工厂那样规范。早上放好的东西,下午可能就换了位置,或者突然会出现宠物挡住去路等障碍。

Gemini Robotics ER 1.6 的重要之处在于,它终于让机器人能够做出“基于常识的判断” [DeepMind’s Gemini 1.6 Gives Robots Point-and-Click … …](https://robohorizon.com/en-us/news/2026/04/deepminds-gemini-16-gives-robots-point-and-click-reality/)。打个比方, 如果以前的机器人是只能按乐谱演奏的八音盒,那么现在的机器人就像是可以根据观众反应进行即兴演奏的表演者。

例如,想象一下在工业现场需要检查燃气阀门的压力时。机器人不仅仅是盯着压力表看。它能自主判断数值是否在正常范围内,如果指针指向危险数值,它会判断应该先关闭哪个阀门并付诸行动 Google’s new AI helpsrobotsunderstand and act inrealworld。这极大地提高了机器人的自主性,帮助人类在无需亲身进入危险环境的情况下,更安全、更高效地完成工作 Gemini Robotics-ER 1.6: Real-World Robotics Intelligence

轻松理解:机器人的新“眼”和“脑”

为了更轻松地理解 Gemini Robotics ER 1.6,我们来看看两个核心概念。

1. 视觉-语言模型 (VLM, Vision-Language Model)

这是一种将机器人观察事物的“眼睛(视觉)”和听懂人类语言的“耳朵(语言)”整合为一体的智能结构 Gemini Robotics-ER 1.6 | Gemini API | Google AI for Developers

  • 通俗地说:就像我们看着食谱上的照片就能立刻明白“啊,那块肉要切成这么大”一样。机器人通过摄像头接收复杂的视频数据,并将其与用户发出的“把那边的红杯子挪开”等自然指令相连接,从而制定准确的行动计划 [Gemini Robotics-ER 1.6 Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/models/gemini-robotics-er-1-6-preview)。

2. 具身推理 (Embodied Reasoning)

这不仅仅是指处理计算机屏幕上的数据,而是指与真实的物理世界(身体,Embodied)相连接的逻辑思考。

  • 打个比方:这是“普通 GPS”和“经验丰富的当地向导”之间的区别。如果传统机器人是只会按预设路线行驶、遇到封路就停下的 GPS,那么搭载了 Gemini Robotics ER 1.6 的机器人就像是一个看到路边施工标志就会自动寻找绕行路线的老练向导。该模型使机器人能够灵活适应环境变化,自主确认所执行的任务是否成功(成功检测),并在失败时决定是否不放弃并再次尝试 Gemini Robotics-ER 1.6 — Google DeepMind

现状:有哪些提升?

这次的 1.6 版本比之前的 1.5 版本要聪明得多。特别是与谷歌最新的通用 AI 模型“Gemini 3.0 Flash”相比,在“机器人专项任务”中,它表现出了压倒性的性能 Google DeepMind ReleasesGeminiRobotics-ER1.6: Bringing…

具体好在哪里呢?

目前,该模型正通过 Gemini APIGoogle AI Studio 提供,以便开发者进行测试并应用于实际机器人中 [Gemini Robotics ER 1.6 powers real-world tasks with enhanced reasoning Trending Stories HyperAI](https://beta.hyper.ai/en/stories/f846584e94ff774dd312356d2d2a6612)。因此,机器人制造商或研究人员只需更改模型名称,即可立即将最新功能移植到机器人中 [Gemini Robotics-ER 1.6 Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview)。

未来会怎样?

Gemini Robotics ER 1.6 的出现,正在让科幻电影中看到的“真正的机器人助手”时代加速到来。现在,机器人不再只能执行“从 A 点移动到 B 点”的简单指令,而是具备了执行“从工具箱里找把锤子放到工作台上”这种复杂语境指令的智能 Gemini Robotics-ER 1.6 — Google DeepMind

在不久的将来,不仅在工厂或实验室,在我们的家或办公室等日常空间里,我们也将看到机器人熟练地判断周围情况并帮助我们的身影。机器人会自动把放在门口的快递拿进屋,或者看到积攒的碗筷就自动开始整理,这难道不值得期待吗?现在,机器人正超越单纯的机器,成为让我们的日常生活更加丰富的聪明伙伴。

AI 的视角

机器人技术正超越“物理躯体”的发展,开始正式具备“智力思考力”。Gemini Robotics ER 1.6 将成为机器人进化的关键一步:机器人不再仅仅是为人类提供便利的工具,而是正在进化为能够自主理解世界并进行沟通的智能合作伙伴。

参考资料

  1. Gemini Robotics ER 1.6: Enhanced Embodied Reasoning
  2. [Gemini Robotics-ER 1.6 Gemini API Google AI for Developers (Overview)](https://ai.google.dev/gemini-api/docs/robotics-overview)
  3. Gemini Robotics-ER 1.6 - The Keyword
  4. [Gemini Robotics-ER 1.6 Gemini API Google AI for Developers (Models)](https://ai.google.dev/gemini-api/docs/models/gemini-robotics-er-1-6-preview)
  5. Gemini Robotics-ER 1.6: Real-World Robotics Intelligence
  6. DeepMind’s Gemini 1.6 Gives Robots Point-and-Click Reality
  7. Google News - Google DeepMind unveils Gemini Robotics-ER 1.6
  8. Gemini Robotics ER 1.6: Enhancing spatial reasoning
  9. Google DeepMind Releases Gemini Robotics-ER 1.6: Bringing Enhanced Embodied Reasoning
  10. DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges
  11. Google’s new AI helps robots understand and act in real world
  12. Gemini Robotics-ER 1.6: Powering real-world robotics tasks — OODAloop
  13. Gemini Robotics-ER 1.6 — Google DeepMind (Official Models Page)
  14. [Gemini Robotics ER 1.6 powers real-world tasks with enhanced reasoning HyperAI](https://beta.hyper.ai/en/stories/f846584e94ff774dd312356d2d2a6612)

FACT-CHECK SUMMARY

  • Claims checked: 10
  • Claims verified: 9
  • Verdict: PASS
测试你的理解
Q1. Gemini Robotics ER 1.6 在哪些领域比之前的模型(1.5)或 Gemini 3.0 Flash 表现更出色?
  • 更快的移动速度
  • 空间及物理推理能力
  • 电池效率
Gemini Robotics ER 1.6 在指向、计数、检测任务是否成功等空间及物理推理任务中,表现优于之前的模型。
Q2. 该模型赋予机器人的核心能力之一,即在物理世界中进行逻辑判断的能力称为什么?
  • 数字孪生
  • 具身推理 (Embodied Reasoning)
  • 云计算
文章解释的核心概念是'具身推理',它帮助机器人理解实际环境并逻辑性地行动。
Q3. Gemini Robotics ER 1.6 目前向谁开放?
  • 普通用户
  • 仅限政府机构
  • 使用 Gemini API 和 Google AI Studio 的开发者
目前该模型通过 Gemini API 和 Google AI Studio 提供给开发者使用。