제미나이 로보틱스 AI공개
훈련 없이 개념만 알려줘도
스스로 판단해 명령 이행
소풍용 도시락 만들기까지
“농구공을 집어서 슬램 덩크를 해줘.”
사람이 로봇에 음성으로 명령을 내리자 로봇팔이 실험실의 장난감 농구 코트에 있는 작은 플라스틱 농구공을 집는다. 그리고 이를 장난감 골대에 집어넣는다. 농구하는 것을 한 번도 학습한 적이 없는 로봇이 스스로 생각해 사람의 말을 이해한 후 행동으로 옮긴 장면이다.
구글은 12일(현지시간) 로보틱스용 인공지능(AI) ‘제미나이 로보틱스’ 적용 사례들을 공개했다. 제미나이 로보틱스는 구글이 만든 거대언어모델(LLM)인 제미나이 2.0을 기반으로 사람의 지시가 로봇의 행동까지 연결시키는 이른바 ‘시각-언어-행동(VLA)’ 모델이다. 제미나이 2.0이 가지고 있는 언어와 시각에 대한 지식을 바탕으로 로봇이 행동을 할 수 있도록 만들었다.
제미나이 로보틱스를 만든 구글 딥마인드 엔지니어 카니슈카 라오는 “로봇이 농구공으로 덩크슛을 하는 걸 처음 봤을 때 팀원들이 매우 흥분했다”며 “이 로봇은 농구와 관련된 것을 전혀 본 적이 없었다. 로봇은 제미나이 모델을 통해 농구 골대의 형태와 덩크슛의 개념을 이해하고, 이를 실제 물리적 세계에서 구현한 것”이라고 설명했다.
제미나이 로보틱스가 가진 큰 장점은 로봇이 특정 업무만을 할 수 있는 것이 아니라 광범위한 일을 이해하고 실행하는 능력을 갖췄다는 점이다. 챗GPT가 사람의 말을 이해하고 다양한 일을 할 수 있는 것과 마찬가지다.
라오는 “제미나이를 로봇에 적용해 다양한 작업을 수행할 수 있는 ‘범용 로봇’ 개발에 한 발짝 더 다가가고 있다”며 “우리의 세계는 매우 복잡하고 역동적이며 풍부한데, 범용 지능 로봇은 이런 혼란을 처리할 수 있어야 한다”고 말했다.
제미나이 로보틱스는 두 개의 로봇팔이 달려 있는 양팔 로봇에 주로 사용되지만, 인간형 로봇에도 적용되고 있다. 구글이 보여준 데모영상 중에는 앱트로닉스의 인간형 로봇이 도시락을 싸는 것도 있었다.
구글은 “제미나이 로보틱스는 실생활에서 다양한 과업을 처리하기 위해 앱트로닉스의 인간형 로봇인 아폴로 같은 복잡한 로봇에도 특화시킬 수 있다”고 강조했다.
이날 구글은 범용 모델인 제미나이 로보틱스 외에도 ‘제미나이 로보틱스 ER’이라는 사고능력이 강화된 모델을 공개했다. ER은 ‘탑재된 사고(Embodied Reasoning)’의 약자로 공간 사고능력이 더 뛰어나다는 점이 특징이다. 로봇이 보고 있는 것이 어떤 물건인지를 파악하거나, 3차원 공간에서 물체를 인식하는 능력이 향상됐다. 제미나이가 가진 코딩 능력을 통해 완전히 새로운 능력을 로봇이 추가할 수도 있다.
구글은 머그잔을 예로 들면서 로봇이 머그잔을 보고서 이를 두 손가락으로 효과적으로 잡는 방법을 생각해낼 수 있다고 설명했다. 특정 영역에서는 제미나이 로보틱스보다 더 뛰어난 능력을 보여준다는 것이다.
구글은 이날 공개한 영상에서는 미국 텍사스주 오스틴에 본사를 두고 있는 앱트로닉스의 로봇영상만 소개했다. 하지만 애자일로봇, 애질리티 로봇(어질리티로보틱스), 보스턴다이내믹스, 인챈티드툴스 같은 로봇 기업과도 테스트를 하고 있다고 밝혔다.
이날 구글이 로봇에 실질적으로 적용할 수 있는 LLM 기반 AI를 공개하면서 빅테크 기업들의 로봇 개발 경쟁은 더욱 가속화할 전망이다.
테슬라는 2021년 인간형 로봇 ‘옵티머스’를 출시하면서 경쟁에서 가장 앞서 있다. 테슬라 자동차 공장 등 생산 현장에 도입하는 것을 목표로 하고 있다. 엔비디아는 직접 로봇을 만들지 않고 로봇에 들어가는 반도체와 로봇을 학습시키기 위한 플랫폼을 서비스 중이다. 많은 로봇 스타트업들이 엔비디아의 기술을 이용해서 인간형 로봇을 만들고 있다.
애플은 로봇팔이 달린 가정용 로봇을 만들고 있다. 스마트폰 시장의 성장이 정체되면서 가정용 로봇을 새로운 성장동력으로 타진하고 있다. 아마존은 물류센터에서 많은 로봇을 사용하고 있다. 무인운반로봇(AGV)과 로봇팔 형태의 로봇을 이미 많이 사용하는 가운데, 어질리티로보틱스와 같은 인간형 로봇 스타트업과도 협력 관계를 구축하고 있다.
메타와 오픈AI도 지난해부터 휴머노이드 로봇팀을 꾸려서 AI와 로보틱스를 함께 연구하고 있다. 구글의 제미나이 로보틱스처럼 로봇이 사람의 언어를 이해하고, 이를 행동으로 옮길 수 있으면 로봇의 활용도가 크게 높아질 것이기 때문이다.
실리콘밸리 이덕주 특파원
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
매주 일요일 밤 0시에 랭킹을 초기화합니다.