'독자 AI 파운데이션 모델' 프로젝트 추진방향. 과학기술정보통신부 제공
국가대표 인공지능(AI) 모델 확보를 위한 거대언어모델(LLM) 개발 프로젝트가 가동된다.
과학기술정보통신부가 정보통신산업진흥원(NIPA)·한국지능정보사회진흥원(NIA)·정보통신기획평가원(IITP)과 '독자 AI 파운데이션 모델' 프로젝트에 참여할 국내 정예팀 공모에 착수한다. 기존 월드 베스트 LLM(WBL) 가칭으로 부르던 프로젝트명을 독자 AI 파운데이션 모델로 확정했다.
글로벌 수준의 독자 AI 파운데이션 모델이 국내에 오픈소스로 확산되면 다양한 AI 서비스 출시와 경제사회 전반의 AI 전환이 가속화될 것으로 전망된다. AI 기술 발전으로 사회적 편익이 확산되는 기반으로 작용할 것이라는 판단에 따라 추진되는 프로젝트다.
정부는 글로벌 파급력 있는 독자 AI 파운데이션 모델 확보를 목표로 민·관 협력을 추진한다. 실력있는 국내 AI 기업·기관 중심 정예팀(컨소시엄 가능)을 대상으로 공모한다. 최대 5개 정예팀을 선발, 단계평가로 경쟁형 압축을 추진한다. 최대 5개팀으로 시작해 경쟁을 통해 지원팀을 줄여가는 방식이다.
특히, 미래 AI 인재 육성 관점에서 대학·대학원생 참여를 필수로 한다. 6개월 이내 출시된 최신 글로벌 AI 모델 대비 95% 이상 성능을 목표로, 참여할 정예팀이 구체적인 개발 전략과 방법론을 주도적으로 제시할 수 있다. 목표와 방법론 등은 단계평가마다 무빙타깃 방식을 도입, 급변하는 AI 기술 환경에 유연하게 대응할 방침이다. 목표만 제시, 구체적 전략과 방법론은 정예팀이 구현하면 된다.
참여 정예팀은 독자 AI 파운데이션 모델 개발에 필요한 그래픽처리장치(GPU), 데이터, 인재 등 희망 자원을 자유롭게 제시할 수 있다. 정부는 추후 평가 등으로 적정규모를 검토해 지원할 계획이다.
국민 AI 접근성 증진, 공공·경제·사회 AI 전환 지원 등 국내 기여 계획도 제시해야 한다. 참여기업 규모와 오픈소스 수준에 따라 정예팀 매칭 비율이 차등화될 예정이다. 다양한 분야 국내외 AI 전문가가 참여하는 평가위원회를 구성해 평가를 진행, 프로젝트 지향점에 걸맞는 정예팀을 선정한다.
오는 12월 등에 이뤄지는 6개월 단위 단계평가의 경우 콘테스트 기반 국민·전문가 평가, 국내외 벤치마크와 한국어 성능·안전성 검증체계 기반 검증평가, 파생 AI 모델 수 기반 파생평가 등이 연계되는 입체적 평가를 추진할 방침이다.
GPU도 지원한다. 내년 상반기까지는 민간이 보유한 1576억원 규모 GPU를 임차 지원한다. 이후 정부 구매 GPU 1만장을 활용해 지원, 팀당 GPU 500장부터 시작해 1000장 이상 규모 GPU를 지원할 예정이다. 또 모든 정예팀의 저작물 데이터 공동구매와 개별 정예팀의 데이터 구축·가공을 지원한다. 팀당 데이터 공동구매는 연간 100억원, 데이터 구축·가공은 연간 30억~50억원 규모다.
또 정예팀이 해외 우수 연구자(팀·재외한인 가능)를 주도적으로 유치할 경우 인건비·연구비 등 필요 비용을 정부가 매칭 지원한다. 2027년까지 연간 20억원 규모 지원이 이뤄진다.
정예팀이 개발한 독자 AI 파운데이션 모델은 오픈소스를 지향, 국내 AI 생태계 확산에 활용한다. AI 안전연구소와의 협업해 독자 AI 파운데이션 모델의 안전성 검증을 뒷받침하고 'K-AI 모델', 'K-AI 기업' 등 명칭을 사용할 수 있도록 해 글로벌 공신력 강화와 글로벌 시장 진출 가속화를 도모한다.
송상훈 과기정통부 정보통신정책실장은 “AI 시대 대한민국 기술주권 확보, 모두의 성장을 도모하는 생태계 구축이 목표”라며 “국내 최고 수준 AI 정예팀들이 도전해 글로벌 수준의 독자 AI 파운데이션 모델을 확보·확산, 대한민국이 AI 강국으로 도약하는 '모두의 AI' 출발점이 되기를 기대한다”고 말했다.
박종진 기자 truth@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.