机器人现在学会“察言观色”了?谷歌 DeepMind 发布机器人新大脑“Gemini Robotics-ER 1.6”

机械臂注视着复杂的工业仪表盘并分析数据,展现出智慧的姿态
AI Summary

谷歌 DeepMind 发布的 Gemini Robotics-ER 1.6 是一款帮助机器人理解物理世界、自主做出判断并执行任务的最新 AI 模型。

机器人,现在开始“思考”并“行动”

想象一下,在机器轰鸣、繁忙复杂的工厂中心,一台机器人正静静地注视着墙上的压力表。片刻后,这台机器人做出判断:“现在的压力已经上升到危险数值,为了安全,需要稍微关小 2 号阀门。”随后,它自主伸手采取了措施。任务结束后,它再次确认仪表盘,自言自语道:“嗯,现在压力正常了。任务完成!”并以此确认自己的成果。

这样的场景,以前可能只觉得是电影里的科幻故事。但现在,它正成为我们身边的现实。因为谷歌 DeepMind (Google DeepMind) 于 2026 年 4 月 14 日隆重发布了为机器人赋予这种高阶智能的新型人工智能模型——“Gemini Robotics-ER 1.6” Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does。该模型有望让机器人摆脱单纯“机器”的角色,进化为能够理解我们所生活的复杂世界并自主做出判断的“智能体 (Agent,具有自主目标并行动的主体)” [Gemini Robotics-ER 1.6 Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview)。

为什么这很重要?

长期以来,我们看到的机器人大多是只擅长做“规定动作”的优等生。它们要么沿着预设的路径移动,要么搬运固定位置的物品。问题在于,我们生活的现实世界并没那么简单。只要物品的位置稍有变动,或者突然有人挡在前面,机器人往往就会陷入慌乱并停滞不前。

Gemini Robotics-ER 1.6 为这些机器人赋予了一种特殊的能力,即“具身推理 (Embodied Reasoning)” Gemini Robotics: Bringing AI into the Physical World。简单来说,“具身推理”是指“机器人利用自己的物理身体,在实际环境中像人类一样思考和判断的能力”。机器人不再仅仅是用眼睛(摄像头)拍摄影像,而是能够从逻辑上把握“那个物体是什么?”、“离我有多少距离?”、“如果我现在碰它会发生什么?” Google News - Google DeepMind unveils Gemini Robotics-ER…

如果说以前的机器人拥有聪明的“眼睛”和结实的“双手”,但缺乏连接这两者的“思考纽带”,那么现在它们终于拥有了能够整合这一切并解读现状的“真正的大脑”。

易于理解:用比喻来看机器人的新能力

还不清楚 Gemini Robotics-ER 1.6 带来的变化?我们可以通过日常生活中熟悉的场景进行比喻,其差异便会一目了然。

1. 说“看那个!”就能心领神会的空间智能

如果对小孩子说“能把桌子上那个红苹果拿给我吗?”,孩子会环视四周找到苹果,估算距离后走过去。Gemini Robotics-ER 1.6 为机器人赋予了这种空间推理 (Spatial Reasoning) 能力 Gemini Robotics-ER 1.6: Powering real-world robotics tasks…。现在,机器人不仅能识别物体,还能执行检测特定对象 (Object Detection)、用手指点 (Pointing)、清点数量 (Counting) 等复杂的空间任务,且精准度大幅提升 Gemini Robotics: Bringing AI into the Physical World

2. “我的作业有没有错?” 自我检查

就像学生做完试题后会再次检查答案一样,机器人现在也具备了“成功检测 (Success Detection)”能力 Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does。机器人在执行某项命令后,会立即通过摄像头观察现场,自主判断“抽屉是否按计划关好了?”、“物品是否安全搬运到了?” Google DeepMind Gemini Robotics-ER 1.6 via Gemini API …。得益于此,机器人即使没有人时刻盯着,也能减少错误并自主工作。

3. 连细微刻度都能读取的“老兵之眼”

最令人惊讶的一点是,机器人现在能够读取工业现场复杂的仪表盘 (Gauges) 或装有液体的玻璃管 (Sight glasses) 的数值 DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges。就像拥有数十年经验的工程师通过观察微弱晃动的指针来解读机器状态一样,机器人现在也能对视觉数据进行高度解析 Google’s new AI helps robots understand and act in real world

现状:进展到什么程度了?

根据谷歌 DeepMind 的说法,这次的 Gemini Robotics-ER 1.6 展现出了远超之前模型(1.5 版本)或通用 AI 模型 Gemini 3.0 Flash 的性能 Gemini Robotics-ER 1.6: Powering real-world robotics tasks…。特别是在机器人面临的“物理情境”推理领域,实现了质的飞跃 Google DeepMind’s New Robot Brain… - AI Universe: A News Startup

目前,搭载了该模型的机器人展现出了以下惊人能力:

谷歌已通过 Gemini API 和 Google AI Studio 向开发者全面开放了这一强大的模型 DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges。现在,全世界的开发者都可以为自己的机器人移植这个“聪明的大脑”了 Google DeepMind Gemini Robotics-ER 1.6 via Gemini API …

未来会怎样?

Gemini Robotics-ER 1.6 的出现将改变我们看待机器人本身的方式。现在,机器人正从只听指令工作的“工具”,变成能够根据情况灵活应对的可靠“伙伴” Google DeepMind Launches Gemini Robotics-ER 1.6 - Colitco

不久的将来,我们将在艰苦的建筑工地、复杂的智能工厂,甚至是温馨的家庭内部,看到这些智能机器人活跃的身影。机器人说出“主人,我看洗衣机里的衣服塞得太多了,所以我调整了洗涤模式”并自主解决问题的日常生活,可能会比预想中更早到来。


AI 的观点 (AI’s Take)

MindTickleBytes AI 记者的观点 如果说过去为机器人装上“眼睛”是第一次革命,那么现在已经开启了通过眼睛“理解”世界并自主决定如何移动身体的“具身推理”时代。Gemini Robotics-ER 1.6 是一个非常重要的里程碑,它证明了 AI 不再仅仅是玩转虚拟世界数据的存在,而是开始理解我们所立足的物理现实定律。人类与机器人安全协作的真正“共存技术”,正从这个小小的脑细胞中萌芽。

参考资料

  1. Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning
  2. Google News - Google DeepMind unveils Gemini Robotics-ER…
  3. Gemini Robotics-ER 1.6: Powering real-world robotics tasks…
  4. DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges
  5. [Gemini Robotics-ER 1.6 Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview)
  6. Gemini Robotics: Bringing AI into the Physical World
  7. Building the Next Generation of Physical Agents with Gemini…
  8. Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does
  9. Google DeepMind Gemini Robotics-ER 1.6 via Gemini API …
  10. Google’s new AI helps robots understand and act in real world
  11. Google DeepMind Launches Gemini Robotics-ER 1.6 - Colitco
  12. Google DeepMind’s New Robot Brain… - AI Universe: A News Startup
  13. Google DeepMind’s new AI models help robots perform physical tasks…

FACT-CHECK SUMMARY

  • 已核实主张:19
  • 已证实主张:19
  • 结论:通过 (PASS)
测试你的理解
Q1. 与之前的版本 (1.5) 相比,Gemini Robotics-ER 1.6 特别强化的能力是什么?
  • 提高机器人的移动速度
  • 增强空间及物理推理能力
  • 优化电池效率
Gemini Robotics-ER 1.6 的空间及物理推理能力比之前的 1.5 版本或 Gemini 3.0 Flash 有了显著提升。
Q2. 通过该模型,机器人在工业现场能够执行的新任务是?
  • 金属焊接
  • 读取工业仪表盘及玻璃窗数值
  • 驾驶自动驾驶汽车
该模型具备了读取工业仪表盘 (Gauges) 或液位计 (Sight glasses) 的能力,使得自主工业检测成为可能。
Q3. 机器人自行确认工作是否顺利完成的功能称为什么?
  • 目标检测
  • 路径预测
  • 成功检测 (Success detection)
该模型的核心功能之一“成功检测”是机器人自行判断所执行的任务是否真正完成的能力。