로봇에게 '상식'이 생긴다면? 구글의 새로운 AI, Gemini Robotics-ER 1.6 공개

산업 현장에서 게이지를 확인하며 작업을 수행하는 지능형 로봇의 모습
AI Summary

구글 딥마인드가 로봇에게 인간의 '상식'과 같은 추론 능력을 부여하는 Gemini Robotics-ER 1.6을 발표하며, 산업 현장의 자율성을 한 단계 높였습니다.

우리 주변의 로봇들은 사실 생각보다 똑똑하지 않습니다. 공장의 로봇 팔은 정해진 위치로만 기계적으로 움직이고, 로봇 청소기는 가끔 낮은 문턱에 걸려 꼼꼼하게 청소하지 못한 채 꼼짝달싹 못 하기도 하죠. 이들에게 부족한 것은 바로 우리 인간이 가진 ‘상식’입니다.

“컵을 집으러 가다가 앞에 장애물이 있으면 돌아가야지” 혹은 “바닥에 물이 있으면 미끄러울 수 있으니 조심해야지” 같은 지극히 당연한 생각 말이죠. 지금까지의 로봇에게 이런 판단은 너무나 어려운 숙제였습니다.

그런데 2026년 4월 14일, 구글 딥마인드(Google DeepMind)가 로봇에게 이러한 ‘상식’을 심어줄 수 있는 새로운 뇌를 발표했습니다. 바로 Gemini Robotics-ER 1.6입니다 Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges - WinBuzzer. 이번 시간에는 이 인공지능이 왜 로봇 기술의 미래를 바꿀 게임 체인저로 불리는지, 우리 삶에는 어떤 변화를 가져올지 쉽고 자세하게 알아보겠습니다.

이게 왜 중요한가요?

지금까지의 로봇은 컴퓨터 코드로 짜인 정교한 ‘매뉴얼’에 따라 움직였습니다. 하지만 우리가 사는 실제 세상은 너무나 복잡하고 수많은 변수가 존재합니다. 매뉴얼에 없는 돌발 상황이 닥치면 로봇은 멈춰버리거나 엉뚱한 행동을 하기 일쑤였죠.

Gemini Robotics-ER 1.6은 로봇에게 체화된 추론(Embodied Reasoning) 능력을 부여합니다 Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning [DeepMinds Gemini 1.6 Gives Robots Point-and-Click … …](https://robohorizon.com/en-us/news/2026/04/deepminds-gemini-16-gives-robots-point-and-click-reality/). ‘체화된 추론’이란 쉽게 말해 로봇이 자신의 몸과 주변 환경을 실시간으로 이해하며 스스로 판단하는 능력을 뜻합니다.
비유하자면, 단순히 시키는 대로만 움직이는 기계에서 상황을 보고 “아, 지금은 이렇게 하는 게 맞겠군”이라고 판단할 수 있는 지능형 ‘요원(Agent)’으로 진화하는 것입니다 [Gemini Robotics-ER 1.6 Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview). 이는 공장이나 위험한 산업 현장에서 로봇이 사람의 도움 없이도 더 안전하고 완벽하게 자율적으로 일할 수 있게 된다는 것을 의미합니다 Gemini Robotics-ER 1.6: Real-World Robotics Intelligence.

쉽게 이해하기: 로봇에게 생긴 ‘눈’과 ‘뇌’

Gemini Robotics-ER 1.6은 시각-언어 모델(Vision-Language Model, VLM)입니다 [Gemini Robotics-ER 1.6 Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview). 눈으로 보는 이미지 정보와 우리가 쓰는 일상 언어를 동시에 이해하고 연결할 수 있다는 뜻이죠. 이 모델의 핵심 능력을 세 가지 비유로 설명해 보겠습니다.

1. “지도를 머릿속에 그리는 능력” (공간 추론)

상상해보세요. 여러분이 한밤중 어두운 방에서 화장실을 갈 때, 불을 켜지 않고도 가구의 위치를 짐작해 요리조리 피해 갈 수 있는 것과 같습니다. 이 모델은 여러 대의 카메라에서 들어오는 복잡한 영상을 조합해 로봇이 서 있는 공간을 입체적으로 파악합니다(Multi-camera reasoning) Gemini Robotics-ER 1.6: Real-World Robotics Intelligence. 단순히 사진을 찍는 것이 아니라, “저 물체는 내 뒤에 있고, 이 벽은 내가 지나갈 수 있는 공간이다”라는 것을 깊이 있게 ‘이해’하는 것이죠 Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does.

2. “숙제를 다 했는지 확인하는 꼼꼼함” (성공 감지)

많은 로봇이 물건을 집으라는 명령을 받으면 단순히 팔을 뻗는 동작만 수행합니다. 중간에 물건을 놓쳐도 “난 팔을 뻗었으니 임무 완료!”라고 생각하고 다음 단계로 넘어가 버리죠. 하지만 이 모델은 성공 감지(Success detection) 기능을 갖추고 있습니다 Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning DeepMind’s Gemini Robotics-ER 1.6 pushes embodied AI into the real world. 작업을 마친 뒤 “정말로 물건이 제대로 옮겨졌나?”를 스스로 확인하고, 만약 실패했다면 다시 시도하거나 멈춥니다 Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does.

3. “전문가의 눈으로 계측기 읽기” (인스트루먼트 리딩)

산업 현장에는 바늘로 된 압력계나 기름 양을 보여주는 유리관(사이트 글라스)이 아주 많습니다. 일반적인 로봇에게는 이것이 그저 복잡한 그림처럼 보일 수 있지만, Gemini Robotics-ER 1.6은 이 눈금들이 현재 무엇을 의미하는지 정확히 읽어낼 수 있습니다 DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges - WinBuzzer DeepMind’s Gemini Robotics-ER 1.6 pushes embodied AI into the real world. 마치 노련한 공장 관리자가 직접 장비를 점검하는 것과 같은 수준입니다.

현재 상황: ‘스팟’이 똑똑해졌어요

로라 그래서(Laura Graesser)와 펑 쉬(Peng Xu) 등 구글의 뛰어난 연구진이 개발한 이 모델은 이미 실제 로봇에 적용되어 놀라운 성과를 보여주고 있습니다 Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning.

특히 보스턴 다이내믹스의 유명한 로봇 개 ‘스팟(Spot)’은 이 모델 덕분에 공장을 스스로 돌아다니며 각종 계측기를 읽고 장비 상태를 정밀하게 점검하는 업무를 수행하게 되었습니다 DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges - WinBuzzer. 이는 이전 버전인 Gemini Robotics-ER 1.5나 고성능 모델인 Gemini 3.0 Flash보다도 물리적 추론 능력(물체 가리키기, 숫자 세기, 궤적 예측 등)에서 훨씬 압도적인 성능을 보인 결과입니다 GeminiRobotics-ER1.6:Poweringreal-worldroboticstasks… GeminiRobotics: Bringing AI into the PhysicalWorld.

이제 로봇에게 “저기 보이는 붉은색 밸브 옆의 압력계를 확인해줘”라고 자연스럽게 말하면, 로봇은 그 의미를 완벽히 이해하고 곧바로 행동으로 옮길 수 있는 수준에 도달한 것입니다 [Gemini Robotics-ER 1.6 Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview).

앞으로 어떻게 될까?

구글 딥마인드의 이번 발표는 로봇이 연구실의 울타리를 벗어나 진짜 우리 삶의 ‘현장’으로 나가는 중요한 신호탄입니다.

가까운 미래에는 사람이 들어가기 매우 위험한 방사능 시설이나 유독 가스 누출 현장에 이 모델을 탑재한 로봇이 가장 먼저 투입될 것입니다. 로봇은 단순히 현장 영상만 전송하는 역할에 그치지 않고, 현장에서 “가스 수치가 위험 수준이니 즉시 메인 밸브를 잠그겠다”는 식의 고차원적인 판단을 내리며 임무를 완수하게 될 것입니다 Gemini Robotics-ER 1.6: Real-World Robotics Intelligence.

또한, 이러한 기술은 더 범용적인 로봇 개발의 든든한 토대가 될 것입니다. 공장뿐만 아니라 우리 가정에서도 복잡한 가사 노동을 척척 돕는 ‘진짜 똑똑한 로봇 도우미’를 만나는 날이 훨씬 더 빠르게 다가올 것으로 기대됩니다 Google unveilsGeminiRoboticsfor building general purposerobots.

AI의 시선

상상해보세요. 아침에 일어나 “냉장고에 있는 우유 유통기한 좀 확인하고, 거실에 어질러진 물건들 제자리에 놔줘”라고 말하면 로봇이 알아서 집안일을 끝내는 풍경을요. 지금까지의 AI가 화면 속에서 텍스트와 이미지로만 대화하는 ‘똑똑한 비서’였다면, Gemini Robotics-ER 1.6을 통해 비로소 ‘세상을 이해하고 움직이는 몸’을 얻게 되었습니다.

로봇이 인간의 언어를 실제 물리적 행동으로 연결하는 이 놀라운 기술은, 머지않아 우리가 SF 영화에서나 꿈꾸던 ‘로봇과의 공존’을 일상적인 현실로 만들어줄 것입니다. AI가 드디어 컴퓨터 밖으로 나와 우리와 함께 걷기 시작한 셈입니다.


참고자료

  1. Gemini Robotics ER 1.6: Enhanced Embodied Reasoning
  2. [Gemini Robotics-ER 1.6 Gemini API Google AI for Developers](https://ai.google.dev/gemini-api/docs/robotics-overview)
  3. Gemini Robotics-ER 1.6 - The Keyword
  4. Gemini Robotics-ER 1.6: Real-World Robotics Intelligence
  5. [DeepMinds Gemini 1.6 Gives Robots Point-and-Click … …](https://robohorizon.com/en-us/news/2026/04/deepminds-gemini-16-gives-robots-point-and-click-reality/)
  6. Gemini Robotics-ER 1.6: What Google’s New Robotics Model Does
  7. DeepMind’s Gemini Robotics-ER 1.6 Lets Spot Read Gauges - WinBuzzer
  8. DeepMind’s Gemini Robotics-ER 1.6 pushes embodied AI into the real world
  9. GoogleNews- Google DeepMind unveilsGeminiRobotics-ER…
  10. GeminiRobotics-ER1.6:Poweringreal-worldroboticstasks…
  11. GeminiRobotics: Bringing AI into the PhysicalWorld
  12. Google unveilsGeminiRoboticsfor building general purposerobots
  13. Building the Next Generation of Physical Agents withGemini…
이 글을 얼마나 이해했나요?
Q1. Gemini Robotics-ER 1.6이 이전 버전이나 Gemini 3.0 Flash와 비교했을 때 특히 강화된 능력은 무엇인가요?
  • 외국어 번역 능력
  • 공간 및 물리적 추론 능력
  • 음악 작곡 능력
Gemini Robotics-ER 1.6은 이전 버전들보다 공간 추론, 물체 가리키기, 숫자 세기, 작업 성공 여부 감지 등 물리적 세계에서의 추론 능력이 크게 향상되었습니다.
Q2. 이번 모델에서 새롭게 강조된 기능 중 하나로, 로봇이 스스로 작업이 끝났는지 확인하는 기능은?
  • 성공 감지(Success Detection)
  • 자동 충전(Auto Charging)
  • 음성 인식(Voice Recognition)
로봇이 자신이 내린 명령을 실제로 완수했는지 스스로 판단하는 '성공 감지' 기능은 자율 로봇의 신뢰성을 높이는 핵심 요소입니다.
Q3. 보스턴 다이내믹스의 '스팟' 로봇이 이 모델을 통해 수행하게 된 새로운 산업용 작업은 무엇인가요?
  • 커피 배달
  • 산업용 게이지(계측기) 읽기
  • 공장 바닥 청소
Gemini Robotics-ER 1.6을 탑재한 스팟은 공장 내 게이지나 사이트 글라스를 읽고 장비 상태를 스스로 점검할 수 있게 되었습니다.
로봇에게 '상식'이 생긴다면? 구글의 새로운 AI...
0:00