인공지능(AI)을 개발하는 신생기업(스타트업) 슈퍼브에이아이는 24일 서울 여의도 콘래드서울호텔에서 기자간담회를 갖고 국내 최초의 산업용 시각(비전) 파운데이션 모델인 '제로' AI를 발표했다. 비전 파운데이션 모델이란 영상, 그림 등을 인식하는 AI를 말한다.
'눈 달린 AI'라고 말할 수 있는 비전 AI는 'GPT'처럼 문자로 대화하는 생성형 AI와 달리 사진, 영상을 인식해 필요한 일을 처리하기 때문에 문자로 상황을 표현하기 힘든 산업현장에서 주로 쓰인다. 예를 들어 폐쇄회로(CC)TV 영상을 살펴보면서 창고에서 사람이 넘어지거나 공장에서 용접 불똥이 튀는 사고가 발생하면 알려 달라는 명령이 가능하다.
김현수 슈퍼브에이아이 대표가 24일 서울 여의도 콘래드서울 호텔에서 기자간담회를 갖고 자체 개발한 비전 파운데이션 모델인 '제로' 인공지능(AI)을 발표하고 있다. 슈퍼브에이아이 제공
이 업체가 개발한 제로는 사전 데이터 학습이 필요 없어 AI 도입 비용을 제로(0)로 만든 점이 특징이다. 차문수 슈퍼브에이아이 기술총괄은 "제로는 이미지 뿐 아니라 언어 데이터까지 같이 학습했다"며 "호랑이를 글로 묘사한 설명이 있으면 사진이 없어도 추론으로 호랑이 이미지를 찾아낸다"고 설명했다. 따라서 이용자가 '녹슨 파이프'처럼 추상적 표현을 사용해도 해당 영상과 이미지를 찾아낸다는 설명이다.
따라서 제로는 사전에 데이터 학습을 하지 않은 업무 현장에도 즉시 투입이 가능한 '제로샷' 능력을 내세우고 있다. 또 문자와 이미지를 모두 사용해 지시할 수 있는 멀티모달 기능과 질의응답, 상품검사, 직원의 행동분석 등 다양한 일을 수행하는 멀티태스크 기능을 갖고 있다. 김현수 슈퍼브에이아이 대표는 "나사 사진을 입력하면 생산시설에서 해당 나사를 탐지해 수량이나 결함 등을 확인한다"고 말했다.
제로의 성능은 비전 파운데이션 모델 분야에서 가장 앞선 중국에 뒤지지 않는다는 평가다. 차 CTO는 "자체 성능 분석에서 중국의 '욜로'와 '티렉스2', '다이노엑스', 미국 마이크로소프트의 '플로렌스2', 구글의 'OWL v2' 등 세계적 비전 파운데이션 AI보다 제로의 탐지 능력이 48% 앞섰다"며 "세계적인 CVPR 객체탐지 대회에서도 중국업체에 이어 2등을 했다"고 밝혔다.
특히 제로는 적은 비용으로 고성능을 발휘해 눈길을 끈다. 차 CTO는 "해외업체들은 엔비디아의 반도체 A100을 장착한 그래픽카드(GPU)를 64~128장 사용해 비전 파운데이션 AI를 개발했다"며 "제로는 10분의 1인 A100 GPU 8장을 사용해 개발됐다"고 강조했다. AI 개발에 쓰이는 A100 가격은 개당 약 1만 달러(약 1,400만 원)다. 제로의 판매방식은 월 이용료를 받는 구독형, 업체의 전산시스템에 설치하는 설치형, 연결 소프트웨어(API)를 제공하는 방식 등 다양하다.
한편 김 대표는 국내 AI 산업 발전을 위해 비전 파운데이션 모델 개발이 절실하다고 제언했다. 그는 "AI 강국이 되려면 LLM과 비전 파운데이션, 로봇을 제어하는 피지컬 AI 등 3대 AI 모델이 골고루 필요하다"며 "그런데 우리나라는 GPT 서비스가 널리 알려지면서 너무 LLM에만 집중하는 경향이 있다"고 꼬집었다. 따라서 그는 "LLM은 선진국과 기술 격차를 좁히는 것이 과제이지만 비전 파운데이션 모델은 우리가 앞서 나갈 수 있다"며 "AI 강국이 되려면 산업혁신에 필요한 비전 파운데이션 모델에 투자하고 적극 활용해야 한다"고 강조했다.
최연진 IT전문기자 wolfpack@hankookilbo.com
Copyright © 한국일보. 무단전재 및 재배포 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.