GraspSAM 전체 파이프라인. GIST 제공
[파이낸셜뉴스] 광주과학기술원(GIST) AI융합학과 이규빈 교수연구팀이 단순한 자동화를 넘어, 작업자와의 협업을 고려한 세계 최고 성능의 혁신적인 로봇 파지 모델 ‘GraspSAM’을 개발했다.
29일 GIST에 따르면 작업자와의 협업을 고려한 혁신적 AI 모델인 GraspSAM은 점, 박스, 텍스트 등 다양한 형태의 프롬프트 입력을 지원하며, 한 번의 추론만으로 물체의 파지점을 정확히 예측할 수 있도록 설계됐다. 이를 통해 기존 모델의 한계를 극복하고, 학습되지 않은 물체라도 복잡한 환경에서 안정적으로 파지할 수 있는 능력을 갖췄다.
연구팀이 개발한 GraspSAM은 SAM의 강력한 객체 분할 능력을 활용해 최소한의 미세 조정만으로 물체의 파지점을 예측하는 혁신적인 모델이다. 이를 위해 어댑터(Adapter) 기법과 학습 가능한 토큰(Learnable Tokens) 기법을 적용해 SAM을 파지점 추론에 최적화했다.
SAM(Segment Anything)은 Meta AI(옛 페이스북)에서 개발한 범용적인 이미지 분할 모델로서 이 모델의 가장 큰 특징은 이름 그대로 어떤 것이라도 분할할 수 있다는 점이다. 기존의 이미지 분할 모델들은 특정 데이터셋이나 특정한 객체에최적화돼 있는 경우가 많았지만, SAM은 사전 학습된 거대한 데이터세트를 기반으로 하기 때문에, 새로운 이미지나 본 적 없는 객체에도 훌륭한 성능을 보인다.
GraspSAM은 프롬프트 기반 입력을 지원하며 사용자가 제공하는 간단한 점, 박스, 텍스트 입력을 통해 다양한 환경·물체·상황에 즉각적으로 적응할 수 있도록 설계됐다.
이를 통해 로봇이 보다 다양한 물체를 손쉽게 잡을 수 있으며, 단 한 번의 연산만으로 파지점을 예측해 산업 현장에서의 적용 범위를 획기적으로 확장했다.
특히, 눈동자 추적 기술과 결합해 작업자의 시선에 맞춰 파지 작업을 수행하는 기능까지 성공적으로 구현함으로써 산업 현장은 물론 다양한 분야에서 폭넓은 활용 가능성을 제시했다.
이규빈 교수는 “GraspSAM 모델은 로봇과 사용자의 직관적인 상호작용을 가능하게 하며, 복잡한 환경에서도 탁월한 파지 능력을 발휘해 산업 현장뿐만 아니라 가정용 로봇, 서비스 로봇 등 다양한 분야에 폭넓게 활용될 것으로 기대한다”고 밝혔다.
GIST AI 융합학과 이규빈 교수가 지도하고, 노상준 박사과정생이 수행한 이번 연구는 산업통상자원부와 과학기술정보통신부의 지원을 받았다. 연구 결과는 로봇 분야 세계 최고 권위 학회인 IEEE ICRA(International Conference on Robotics and Automation)에서 5월 발표될 예정이다.
jiany@fnnews.com 연지안 기자
Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.