최예진 엔비디아 LLM 연구부문 선임디렉터 인터뷰
스탠퍼드 AI 연구 한국계 석학
엔비디아 제안에 LLM팀 합류
"20년 전 AI 전공, 주변서 말려
韓공학, 트렌드 좇는문화 강해
美빅테크 기술 의존하지 말고
한국 고유의 LLM 개발해야"
최예진 엔비디아 대형언어모델(LLM) 연구 부문 선임디렉터가 매일경제와 인터뷰하고 있다. 배병민 MBN 기자
최예진 스탠퍼드대 교수는 지난해 말 인공지능(AI) 열풍의 중심에 있는 엔비디아에 합류해 세간을 놀라게 했다. AI 분야에서 상대적으로 뒤처져 있는 한국이지만 세계 최고 테크 기업 중 하나인 엔비디아의 AI 연구를 진두지휘하는 한국계 석학이 나왔기 때문이다. 최 교수는 한국에선 잘 알려지지 않은 인물이지만 세계 무대에선 이미 존재감이 큰 AI 연구자다. 전문 분야인 자연어처리(NLP) 부문에서 세계적인 권위자다.
연구 실적도 화려하다. 지금까지 세계 최고 귄위의 AI 학회(학술대회)인 ACL, NeurIPS, CVPR 등 6곳에서 총 8개의 최우수·우수 논문상을 받았다. 이 같은 업적으로 2022년 '천재들의 상'이라 불리는 맥아더펠로십을 수상했다. 2023년엔 영국 타임스가 선정한 'AI 분야 영향력 있는 100인'에 한국계로선 유일하게 선정됐다. 최 교수는 현재는 미국 국적이다.
지난 1월 스위스 다보스에서 열린 세계경제포럼(WEF)에선 대표 AI 세션에 연사로 참여했다. 당시 최 교수는 요슈아 벤지오 캐나다 몬트리올대 교수, 앤드루 응 스탠퍼드대 교수 등 'AI 4대 천왕'으로 불리는 세계 최고 석학들과 어깨를 나란히 했다.
엔비디아의 대형언어모델(LLM) 연구 부문 선임디렉터이자 스탠퍼드대 인간중심AI연구소 교수로 재직 중인 최 교수를 매일경제가 최근 만나봤다.
-엔비디아에 합류하게 된 계기가 궁금하다. 어떤 업무를 하나.
▷어느 날 제안이 왔다. 엔비디아에 들어오면서 내 연구팀을 꾸려보라고 하더라. 새롭게 도전해보고 싶어 수락했다. 업무 핵심은 미래지향적 LLM을 연구하는 것이다. 대체 학습 방법, 대체 모델 구조 등을 연구할 계획이다.
-구체적으로 설명해달라.
▷현재 LLM이 생성되는 과정은 다소 획일화돼 있다. 기본구조 설계, 사전 학습, 정렬, 세부 조정, 인간 피드백을 통한 강화 학습 등 일련의 순서로 진행된다. 내 연구는 기존 방식과 다른 새로운 훈련 전략을 시도하거나 트랜스포머 기반이 아닌 아예 새로운 대체 모델을 설계해보는 것이다.
-해당 연구의 궁극적인 목표는.
▷비용 절감이다. 일단 비즈니스는 이윤이 나야 하는데, 지금 LLM은 그런 것이 별로 없다. 개발·운영 비용이 어마어마하기 때문이다. 현재 오픈AI가 LLM 분야를 주도하고 있지만 결국 수익으로 이어지지 않으면 무슨 소용인가 하는 생각이다. AI가 더욱 보편화되고 다양한 수익을 창출하려면 비용을 낮춰야 한다. 비용을 절감하려면 작은 모델이 더 효율적으로 학습하는 모델을 연구하는 게 무엇보다 중요하다.
-엔비디아의 사업과 연관이 있나.
▷내가 하는 일은 순수 연구 쪽이다. 엔비디아의 특정 프로젝트를 감안해 연구 계획을 잡진 않는다.
-LLM 연구가 빅테크에 의존하고 있는 현실에 대해 비판적인데.
▷그렇다. 오픈AI와 앤스로픽 등 선도업체가 LLM 연구를 주도하며 일각에선 '걔네가 만들어주는 것을 그냥 쓰면 되지, 굳이 우리가 따로 모델을 개발할 필요가 있나' 하는 분위기가 있다. 이는 위험한 생각이다. 한국도 한국만의 LLM이 있는 게 바람직하다. 미국에만 의존하다가 가격이 오른다거나 서비스를 제공하지 않으면 어떡하나. 자국의 고유한 기술을 갖는 게 중요하다.
-비용이 많이 들지 않나.
▷물론 그렇다. 작은 스타트업이나 연구소는 자본이 많지 않으면 반드시 비용 문제에 맞닥뜨릴 수밖에 없다. 대체 모델 개발이 중요한 이유다. 내가 엔비디아에서 하는 연구 역시 작은 모델과 적은 데이터, 부족한 그래픽처리장치(GPU)로 더 좋은 LLM을 만드는 데 목적이 있다.
-대체 모델 개발이 가능할까.
▷가능성을 미리 알고 연구를 하진 않는다. 다만 과학계엔 선입견이 정말 어마어마하다. 하나의 트렌드가 탄생하면 그거 아니면 절대 안 될 것처럼 선입견이 확산되곤 한다. 그러나 오픈AI의 챗GPT가 사용하는 알고리즘 역시 예전엔 학계에서 외면당했던 알고리즘이었다. 사람들이 아직 생각해보지 못한 새로운 방향으로, 좀 진취적으로 연구를 하는 게 중요하다고 생각한다.
-언제부터 AI 연구를 시작했나.
▷대학(서울대 컴퓨터공학과)을 졸업하고 마이크로소프트에서 3년간 소프트웨어 엔지니어로 일했다. 이후 직장을 그만두고 AI를 공부하기 위해 박사과정에 들어갔다.
-세계적인 AI 연구자가 된 비결은.
▷글쎄, 잘 모르겠다. 굳이 추측해 보자면 나는 트렌드를 좇지 않는 편이다. 남들이 잘 하지 않는 분야여도 하고 싶으면 실패하더라도 도전하는 것에 의미를 둔다. '유니크'한 연구를 하다 보니 국제 무대에서 좀 통한 것 같다.
-AI 석학 중 한국계는 극히 드물다.
▷한국의 공학계는 주류를 따라가려는 경향이 강한 것 같다. 누구 탓은 아니다. 문화가 그렇다. 내가 박사과정 분야를 AI로 선택했을 때, 특히 자연어처리는 한국인이 굉장히 기피하는 분야였다. 당시(2000년대 초반) AI는 혹한기였다. 굳이 그런 분야에서 박사학위를 받겠다고 하자 지인 모두가 '워워' 하는 분위기였다.
-잘 다니던 마이크로소프트를 그만두고 AI 연구에 뛰어들었다.
▷내가 마이크로소프트에서 하던 업무는 요즘으로 치면 오픈AI와 같은 '핫'한 분야였다. 이런 상황에서 마이크로소프트를 그만두고 AI 박사를 하러 간다는 것은 미국 사람들도, 더군다나 한국 사람들은 더더욱 이해할 수 없는 선택이었다. 나한테 조언해 주시는 한국분들은 '어차피 교수도 못 할 거, 왜 AI를 전공하려 하느냐'며 보따리 싸서 말리는 분위기였다.
-모두가 말렸는데, 왜 AI를 택했나.
▷박사과정을 시작할 때 교수가 되겠다는 목표는 없었다. 그저 AI가 언젠가는 미래에 크게 뜨지 않을까 하고 생각했다. 미리 시작하면 나중에 AI가 트렌드가 됐을 때 남들보다 앞서 있지 않을까 하는 막연한 기대에서였다. 이렇게 교수가 되고 국제 콘퍼런스에 불려다니게 될 줄은 상상도 못 했다.
-미국 국적을 취득한 이유가 있나.
▷처음엔 영주권만 따려고 했다. 시간이 지체되는 와중에 서둘러 출장을 가야 하는 상황이 발생했다. 시민권은 바로 나올 수 있어서 급한 대로 신청했다. 한국 정부에서 이중 국적을 인정해주지 않다 보니 불가피하게 미국 국적을 취득하게 됐다. 이 점은 좀 아쉽게 생각한다.
[연규욱 기자]
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
매주 일요일 밤 0시에 랭킹을 초기화합니다.