GIST
GIST 연구팀이 개발한 보행자 경로 예측 알고리즘은 기존 수치 기반 모델과 비교해 실제 경로에 더 가깝게 예측하는 데 성공했다. GIST 제공
자율주행 차량이나 배달로봇 등은 교통 법규를 준수하며 보행자의 동선을 예측하는 것이 중요하다. 국내 연구팀이 거대언어모델(LLM)로 질문-답변 형식을 통해 보행자의 경로와 최종 도착 위치를 추정하는 알고리즘을 개발했다. 보행자의 안전을 확보하고 인공일반지능(AGI)의 실용화를 앞당길 것으로 기대된다.
광주과학기술원(GIST)은 전해곤 AI대학원 교수팀이 거대언어모델(LLM)로 인간의 사고를 모방해 보행자 경로를 정확하게 예측하는 알고리즘을 개발했다고 18일 밝혔다. LLM은 방대한 텍스트를 학습해 인간 언어를 이해하고 생성하는 딥러닝 기반의 인공지능(AI) 모델이다. 연구결과는 컴퓨터비전(CV) 국제학술대회 'CVPR'에서 19일 발표된다.
지금까지 AI로 보행자의 경로를 예측할 때 '수치 회귀 기법'이 주로 활용됐다. 수치 회귀 기법은 수학적·통계적 모델을 활용해 변수 사이의 관계를 예측하는 방법이다. 숫자 계산만으로 보행 가능 경로와 최종 도착지를 예측하기 때문에 인간 사고를 대변하기에는 한계가 있다는 평가다.
GIST 연구팀이 개발한 알고리즘은 기존 수치 기반 인공지능(AI) 모델과 달리 언어 기반으로 보행자의 미래 경로를 예측한다. GIST 제공
연구팀은 LLM의 방대한 지식과 언어 데이터를 통해 보행자의 현재 상태와 주변 사람들의 관계를 인간의 사고와 유사하게 예측하는 알고리즘을 개발했다. 보행자의 경로와 장면 이미지를 텍스트로 변환하고 보행 방향과 도착지 예상, 충돌 가능성, 지나가는 순서 등을 파악할 때 '사회적 추론(Social Reasoning)'을 하도록 했다. 보행자의 경로를 예측하는 과정을 질문-답변 형태로 재구성한 것이다.
기존 수치 회귀 모델에서는 보행자의 움직임을 연속적인 신호로 해석했지만 연구팀이 개발한 모델은 불연속적으로 인식했다. 보행자의 한 걸음 한 걸음을 일종의 패턴으로 인지해 다음에 발 디딜 위치를 예측한다는 뜻이다. 언어모델이 추론 결과를 대화 형식으로 알려줄 수 있다는 점도 특징이다.
전해곤 교수는 "거대언어모델이 인간 사고방식을 모사해 사회적 관계성을 추론하며 인간의 행동 역학을 배워 미래 동작을 예측했다는 데 학술적 의의가 크다"며 "거대언어모델이 물리 역학적 추론까지 가능하면 인공일반지능(AGI)으로의 확장과 실용화를 앞당길 것"이라고 기대했다.
[이병구 기자 2bottle9@donga.com]
Copyright © 동아사이언스. 무단전재 및 재배포 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.