네이버가 지난 4월 오픈소스로 공개한 '하이퍼클로바X' 경량모델
"초경량 모델이면서 상용 서비스에 접목할 수 있는 성능 호평"
허깅페이스 모델 다운로드 순위 (3B~6B 범위, 7월 18일 기준)
(서울=뉴스1) 손엄지 기자 = 네이버클라우드가 지난 4월 오픈소스로 공개한 '하이퍼클로바X'의 경량모델이 다운로드 수 100만 건을 돌파하며 기술력을 인증받았다.
업계에서는 통상 공개 첫 달 30만~40만 다운로드를 기록하면 흥행한 오픈소스 모델이라고 판단한다.
20일 글로벌 인공지능(AI) 모델 공유 커뮤니티 '허깅페이스'에 따르면 최근 하이퍼클로바X의 경량 모델 'HyperCLOVA X SEED' 시리즈 3종(3B, 1.5B, 0.5B)의 누적 다운로드 수가 100만 건을 돌파했다.
HyperCLOVA X SEED 3종 모델은 공개 후 3개월여가 지났지만 오픈소스 커뮤니티에서 입소문을 타며 다운로드 수가 꾸준히 증가하고 있다.
하이퍼클로바X는 네이버(035420)가 만든 초거대언어모델(LLM)이다. 1차 파생모델만 50여개이며, 해당 모델들을 바탕으로 2차, 3차 파생모델들이 만들어지며 기술 생태계가 빠르게 확장하고 있다.
이번에 공개한 오픈소스는 연구용뿐만 아니라 상업 목적으로도 무료로 이용할 수 있어 실제 서비스에도 활용이 관찰되고 있다.
ZETIC.ai 링크드인 게시물 화면 갈무리
온디바이스 AI 소프트웨어 스타트업 'ZETIC.ai'는 HyperCLOVA X SEED 0.5B를 활용해 비행기 모드에서도 작동하는 한국어 온디바이스 AI를 만들었다고 지난달 발표하기도 했다.
네이버 관계자는 "그래픽처리장치(GPU) 리소스 부담 없이 사용할 수 있는 초경량 모델이면서 상용 서비스에 접목할 수 있는 성능이라는 점이 인기 요인"이라고 설명했다.
0.5B 모델 학습 비용 비교 (클로바 테크 블로그 제공)
네이버는 단순히 모델의 파라미터 개수를 늘려 규모를 키우는 방식으로(scaling) 고성능 AI가 아닌, 같은 크기에서 보다 경제적으로 운용할 수 있고 상대적으로 우수한 성능을 보이는 모델을 구축하는 기술을 확보하는 데 주력해 왔다.
예를 들어 3종 모델 중 가장 작은 HyperCLOVA X SEED 0.5B는 엔비디아 A100 GPU를 기준으로, 사전 학습에 드는 비용(GPU Hours)이 같은 크기의 모델(Qwen2.5-0.5B)보다 약 39배 적다.
그럼에도 한국어, 영어, 수학 등 주요 부문의 성능은 유사하거나 더 높은 수준으로 벤치마크 점수가 산출됐다. 한국어는 주요 벤치마크 테스트에서 모두 상대적으로 높은 점수를 획득했다.
모델의 규모를 키워 성능을 높이는 것은 GPU 자원을 많이 투입하면 어느 정도 달성할 수 있다. 반면 같은 크기에서 더 효율적인 모델을 설계하는 것은 기술력의 영역이다.
네이버 관계자는 "효율적 모델 설계 기술을 확보했다는 것은 충분한 자원을 투입했을 때 언제든 가장 고성능의 모델을 만들 수 있는 기반을 갖췄다는 의미"라고 말했다.
한편, 3종 모델 중 가장 인기 있는 모델은 HyperCLOVA X SEED 3B다. 최근 한 달 동안의 다운로드 수가 56만 회를 돌파했는데 허깅페이스에 등록된 약 180만 개의 모델 중 다운로드 수 상위 0.02%에 해당하는 수치다.
eom@news1.kr
Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.