Google DeepMind 推出了无需联网即可在机器人内部直接运行的人工智能“Gemini Robotics On-Device”,开启了无延迟、快速且精细的机器人动作时代。
断网也能行!家用机器人开启“自主思考”
请试着想象一下电影中的一个场景:你家的家务机器人正在厨房里精细地搬运盘子。突然,天空中雷电交加,家里的 Wi-Fi 断了,或者互联网信号变得极弱。如果是传统的机器人,会发生什么?它们可能会立即停止动作,或者为了等待遥远服务器(云端)的响应,呆立在那里思考“我该怎么办?”。在最坏的情况下,仅仅刹那间的指令延迟就可能导致机器人摔碎手中昂贵的盘子。
但现在,这种担忧或许将成为过去。Google DeepMind 推出了一项创新技术,让机器人无需互联网这一“生命线”也能自主观察、理解并采取行动。这就是为机器人植入独立大脑的 “Gemini Robotics On-Device(端侧 Gemini 机器人模型)”。
为什么这很重要? (Why It Matters)
当我们用智能手机玩游戏时,片刻的“卡顿(延迟)”可能只是让人感到烦躁;但对于在现实物理世界中搬运重物的机器人来说,“卡顿”可能导致致命的事故或损坏。这项技术之所以成为机器人领域的“游戏规则改变者”,原因非常明确:
- 快于光速的反应速度:以往,机器人看到眼前的物体后,需要将图像发送到远程服务器进行分析,再接收行动指令。这一过程中产生的数百毫秒时差是精细作业的天敌。“Gemini Robotics On-Device”在机器人体内完成所有处理,因此延迟(Low-latency)极低 [Gemini Robotics On-Device — Google DeepMind]。
- 在互联网盲区也无懈可击:即使在地下仓库、通信不稳的户外,甚至是完全没有网络覆盖的灾难现场等艰苦环境下,机器人也能聪明地执行任务。机器人不再需要时刻徘徊在无线路由器附近 [DeepMind 的 Gemini Robotics On-Device 为本地机器人带来先进 AI]。
- 彻底的隐私保护:家务机器人在客厅走动时拍摄的视频不被传输到外部服务器,这是一个巨大的优势。室内布局或家人的隐私信息仅在机器人内部处理并随后销毁,安全性得到了飞跃式的提升。
通俗易懂:为机器人植入“自主大脑” (The Explainer)
为了更轻松地理解这项技术,我们可以用“厨师”来打比方:
- 传统方式(云端机器人学):就像厨师每切一次洋葱都要打电话问餐馆外的总厨:“主厨,我现在可以切了吗?”;每开一次火都要问:“主厨,我现在可以开火了吗?”如果电话断了或通话质量不好,烹饪就会立即中断。
- 新方式(端侧机器人学):就像厨师已经完全掌握了食谱并具备了判断力后走进厨房。即使不与外界联系,他也能根据眼前食材的状态立即完成烹饪。打个比方,机器人就像是扔掉了“对讲机”,拥有了能独立思考的“真正的大脑”。
| Google DeepMind 于 2025 年 6 月 24 日正式发布了这款专为在机器人设备现场直接运行而优化的模型 [Gemini 机器人 - 维基百科], [[谷歌推出可在本地机器人上运行的新 Gemini 模型 | TechCrunch](https://techcrunch.com/2025/06/24/google-rolls-out-new-gemini-model that-can-run-on-robots-locally/)]。该模型是 2025 年 3 月首次推出的“Gemini Robotics”模型的轻量化增强版,旨在设备内部有限的硬件资源下实现最高效率 [Gemini Robotics On-Device 为本地机器人带来 AI — Google DeepMind]。 |
特别值得一提的是,该模型被称为 VLA(Vision-Language-Action,视觉-语言-行动) 模型。简单来说,这意味着一个 AI 模型就能统一管理机器人通过摄像头观察世界(Vision)、理解人类下达的复杂指令(Language)以及实际移动手臂进行行动(Action)的全过程 [Google DeepMind 为机器人推出端侧 Gemini AI 模型]。
现状:双臂操作更柔顺、更精细 (Where We Stand)
谷歌解释说,该模型将最新 AI Gemini 2.0 强大的多模态推理(Multimodal reasoning)能力带到了物理世界。所谓多模态推理,是指能够同时理解和判断文字、图像、声音以及空间深度等多种信息的能力 [Gemini Robotics On-Device 为本地机器人带来 AI — Google DeepMind]。
目前这项技术达到的水平已经远超我们的想象:
- 双臂机器人的标准:该模型特别为像人类一样拥有双臂的机器人而设计。这使得机器人不仅能简单地移动物品,还能实现诸如“一只手按住盒子,另一只手取出内容物”这样“灵巧的操作(Dexterous manipulation)” [Google DeepMind 为机器人推出端侧 Gemini AI 模型], [Gemini Robotics On-Device — Google DeepMind]。
- 惊人的适应力:即使进入从未去过的陌生房间,或面对从未见过的物品,机器人也不会慌张。它具备根据现有知识迅速适应新环境并完成任务的能力 [Deepmind 发布新一代机器人 AI 模型:Gemini Robotics On-Device]。
- 给开发者的礼物:机器人制造商现在可以采用这款强大的模型,并根据自家机器人的特性进行性能改进和定制化微调(Fine-tuning) [Gemini Robotics — Google DeepMind]。
未来会怎样? (What’s Next)
Gemini Robotics On-Device 的出现就像是机器人技术的“独立宣言”。现在,机器人已经准备好剪断云端这根“脐带”,走向现实世界中粗糙且充满不确定性的环境。
谷歌充满自信地表示,这是其机器人模型中“最强大的、专为在机器人设备上本地运行而优化的 VLA 模型” [Gemini Robotics On-Device 为本地机器人带来 AI - Google DeepMind]。
让我们畅想一下未来的日常生活: 不久之后,我们将看到在物流中心不知疲倦地分类包裹的聪明机器人、在手术室里精准捕捉医生手势并递送器械的医疗辅助机器人,以及最终出现在我们家客厅里叠衣服、整理孩子玩具的家务机器人。即使互联网突然中断,你也可以放心,因为机器人会默默地继续履行它的职责。
摆脱了互联网的束缚,能够自主判断情况并敏捷行动的机器人。我们曾在科幻电影中看到的未来,正通过 Gemini Robotics On-Device 大步向我们走来。
AI 的视角 (AI’s Take)
MindTickleBytes AI 记者的视角: “如果说过去的机器人只是按照预先输入的‘指令’乐谱演奏的机器,那么搭载了 Gemini Robotics On-Device 的机器人则更接近于能够感受现场氛围并进行即兴演奏的音乐家。解开了互联网这一枷锁的机器人,其活动舞台将无限扩展到客厅、工厂,甚至是外层空间。这不仅是技术上的进步,更是机器人蜕变为人类真正伴侣的重要转折点。”
参考资料
- Gemini Robotics - Wikipedia
- Gemini Robotics On-Device brings AI to local robotic devices — Google DeepMind
- Gemini Robotics On-Device brings AI to local robotic devices - Google DeepMind
- Gemini Robotics On-Device — Google DeepMind
- Gemini Robotics — Google DeepMind
-
[Google rolls out new Gemini model that can run on robots locally TechCrunch](https://techcrunch.com/2025/06/24/google-rolls-out-new-gemini-model-that-can-run-on-robots-locally/) - Gemini New Robotics On-Device: AI That Doesn’t Need the Internet - SmythOS
- DeepMind’s Gemini Robotics On-Device brings advanced AI to local robots
- Google DeepMind introduces on-device Gemini AI model for robots
- Deepmind Launches New Generation Robot AI Model: Gemini Robotics On-Device
-
[AI Robotics: Google DeepMind’s On-Device Model AI Magazine](https://aimagazine.com/news/google-launches-offline-gemini-ai-model-for-robots) - Google DeepMind Launches Gemini Robotics On-Device for Real-Time, Cloud …
- Deepmind Launches New Generation Robot AI Model: Gemini Robotics On-Device
- Google DeepMind Announces Robotics Foundation Model Gemini … - InfoQ
FACT-CHECK SUMMARY
- 查验声明数量:17
- 已证实声明数量:17
- 结论:通过 (PASS)
- 让机器人的外观变得更漂亮
- 无需联网,AI 直接在机器人设备内运行
- 将机器人的电池寿命延长 10 倍
- Gemini 1.0
- Gemini 1.5 Pro
- Gemini 2.0
- 双臂机器人
- 仅带轮子的机器人
- 飞行的无人机