断网也能行!家用机器人开启“自主思考”:Gemini Robotics On-Device

双臂机器人正在精细地操作复杂物品,旁边强调了充当机器人大脑的端侧 AI 芯片。
AI Summary

Google DeepMind 推出了无需联网即可在机器人内部直接运行的人工智能“Gemini Robotics On-Device”,开启了无延迟、快速且精细的机器人动作时代。

断网也能行!家用机器人开启“自主思考”

请试着想象一下电影中的一个场景:你家的家务机器人正在厨房里精细地搬运盘子。突然,天空中雷电交加,家里的 Wi-Fi 断了,或者互联网信号变得极弱。如果是传统的机器人,会发生什么?它们可能会立即停止动作,或者为了等待遥远服务器(云端)的响应,呆立在那里思考“我该怎么办?”。在最坏的情况下,仅仅刹那间的指令延迟就可能导致机器人摔碎手中昂贵的盘子。

但现在,这种担忧或许将成为过去。Google DeepMind 推出了一项创新技术,让机器人无需互联网这一“生命线”也能自主观察、理解并采取行动。这就是为机器人植入独立大脑的 “Gemini Robotics On-Device(端侧 Gemini 机器人模型)”

为什么这很重要? (Why It Matters)

当我们用智能手机玩游戏时,片刻的“卡顿(延迟)”可能只是让人感到烦躁;但对于在现实物理世界中搬运重物的机器人来说,“卡顿”可能导致致命的事故或损坏。这项技术之所以成为机器人领域的“游戏规则改变者”,原因非常明确:

  1. 快于光速的反应速度:以往,机器人看到眼前的物体后,需要将图像发送到远程服务器进行分析,再接收行动指令。这一过程中产生的数百毫秒时差是精细作业的天敌。“Gemini Robotics On-Device”在机器人体内完成所有处理,因此延迟(Low-latency)极低 [Gemini Robotics On-Device — Google DeepMind]。
  2. 在互联网盲区也无懈可击:即使在地下仓库、通信不稳的户外,甚至是完全没有网络覆盖的灾难现场等艰苦环境下,机器人也能聪明地执行任务。机器人不再需要时刻徘徊在无线路由器附近 [DeepMind 的 Gemini Robotics On-Device 为本地机器人带来先进 AI]。
  3. 彻底的隐私保护:家务机器人在客厅走动时拍摄的视频不被传输到外部服务器,这是一个巨大的优势。室内布局或家人的隐私信息仅在机器人内部处理并随后销毁,安全性得到了飞跃式的提升。

通俗易懂:为机器人植入“自主大脑” (The Explainer)

为了更轻松地理解这项技术,我们可以用“厨师”来打比方:

  • 传统方式(云端机器人学):就像厨师每切一次洋葱都要打电话问餐馆外的总厨:“主厨,我现在可以切了吗?”;每开一次火都要问:“主厨,我现在可以开火了吗?”如果电话断了或通话质量不好,烹饪就会立即中断。
  • 新方式(端侧机器人学):就像厨师已经完全掌握了食谱并具备了判断力后走进厨房。即使不与外界联系,他也能根据眼前食材的状态立即完成烹饪。打个比方,机器人就像是扔掉了“对讲机”,拥有了能独立思考的“真正的大脑”。
Google DeepMind 于 2025 年 6 月 24 日正式发布了这款专为在机器人设备现场直接运行而优化的模型 [Gemini 机器人 - 维基百科], [[谷歌推出可在本地机器人上运行的新 Gemini 模型 TechCrunch](https://techcrunch.com/2025/06/24/google-rolls-out-new-gemini-model that-can-run-on-robots-locally/)]。该模型是 2025 年 3 月首次推出的“Gemini Robotics”模型的轻量化增强版,旨在设备内部有限的硬件资源下实现最高效率 [Gemini Robotics On-Device 为本地机器人带来 AI — Google DeepMind]。

特别值得一提的是,该模型被称为 VLA(Vision-Language-Action,视觉-语言-行动) 模型。简单来说,这意味着一个 AI 模型就能统一管理机器人通过摄像头观察世界(Vision)、理解人类下达的复杂指令(Language)以及实际移动手臂进行行动(Action)的全过程 [Google DeepMind 为机器人推出端侧 Gemini AI 模型]。

现状:双臂操作更柔顺、更精细 (Where We Stand)

谷歌解释说,该模型将最新 AI Gemini 2.0 强大的多模态推理(Multimodal reasoning)能力带到了物理世界。所谓多模态推理,是指能够同时理解和判断文字、图像、声音以及空间深度等多种信息的能力 [Gemini Robotics On-Device 为本地机器人带来 AI — Google DeepMind]。

目前这项技术达到的水平已经远超我们的想象:

未来会怎样? (What’s Next)

Gemini Robotics On-Device 的出现就像是机器人技术的“独立宣言”。现在,机器人已经准备好剪断云端这根“脐带”,走向现实世界中粗糙且充满不确定性的环境。

谷歌充满自信地表示,这是其机器人模型中“最强大的、专为在机器人设备上本地运行而优化的 VLA 模型” [Gemini Robotics On-Device 为本地机器人带来 AI - Google DeepMind]。

让我们畅想一下未来的日常生活: 不久之后,我们将看到在物流中心不知疲倦地分类包裹的聪明机器人、在手术室里精准捕捉医生手势并递送器械的医疗辅助机器人,以及最终出现在我们家客厅里叠衣服、整理孩子玩具的家务机器人。即使互联网突然中断,你也可以放心,因为机器人会默默地继续履行它的职责。

摆脱了互联网的束缚,能够自主判断情况并敏捷行动的机器人。我们曾在科幻电影中看到的未来,正通过 Gemini Robotics On-Device 大步向我们走来。


AI 的视角 (AI’s Take)

MindTickleBytes AI 记者的视角: “如果说过去的机器人只是按照预先输入的‘指令’乐谱演奏的机器,那么搭载了 Gemini Robotics On-Device 的机器人则更接近于能够感受现场氛围并进行即兴演奏的音乐家。解开了互联网这一枷锁的机器人,其活动舞台将无限扩展到客厅、工厂,甚至是外层空间。这不仅是技术上的进步,更是机器人蜕变为人类真正伴侣的重要转折点。”


参考资料

  1. Gemini Robotics - Wikipedia
  2. Gemini Robotics On-Device brings AI to local robotic devices — Google DeepMind
  3. Gemini Robotics On-Device brings AI to local robotic devices - Google DeepMind
  4. Gemini Robotics On-Device — Google DeepMind
  5. Gemini Robotics — Google DeepMind
  6. [Google rolls out new Gemini model that can run on robots locally TechCrunch](https://techcrunch.com/2025/06/24/google-rolls-out-new-gemini-model-that-can-run-on-robots-locally/)
  7. Gemini New Robotics On-Device: AI That Doesn’t Need the Internet - SmythOS
  8. DeepMind’s Gemini Robotics On-Device brings advanced AI to local robots
  9. Google DeepMind introduces on-device Gemini AI model for robots
  10. Deepmind Launches New Generation Robot AI Model: Gemini Robotics On-Device
  11. [AI Robotics: Google DeepMind’s On-Device Model AI Magazine](https://aimagazine.com/news/google-launches-offline-gemini-ai-model-for-robots)
  12. Google DeepMind Launches Gemini Robotics On-Device for Real-Time, Cloud …
  13. Deepmind Launches New Generation Robot AI Model: Gemini Robotics On-Device
  14. Google DeepMind Announces Robotics Foundation Model Gemini … - InfoQ

FACT-CHECK SUMMARY

  • 查验声明数量:17
  • 已证实声明数量:17
  • 结论:通过 (PASS)
测试你的理解
Q1. Gemini Robotics On-Device 的最大特点是什么?
  • 让机器人的外观变得更漂亮
  • 无需联网,AI 直接在机器人设备内运行
  • 将机器人的电池寿命延长 10 倍
正如“On-Device”(端侧/设备上)这个名字所示,其核心在于 AI 直接在机器人硬件本身运行,无需互联网或云端连接。
Q2. Gemini Robotics On-Device 基于哪款最新的 AI 模型?
  • Gemini 1.0
  • Gemini 1.5 Pro
  • Gemini 2.0
该模型将 Gemini 2.0 强大的推理能力和对世界的理解带到了物理机器人世界。
Q3. 该 AI 模型特别为哪种形式的机器人设计?
  • 双臂机器人
  • 仅带轮子的机器人
  • 飞行的无人机
Google DeepMind 表示,该模型是专门作为双臂(two-armed)机器人的基础模型而设计的。