설립 3년차 중국 AI 스타트업 혜성
1조개 파라미터 모델 ‘키미 K2’ 개발해
상업 이용까지 가능하도록 모델 개방
주요 코딩 벤치마크서 딥시크 뛰어넘어
문샷AI의 생성형 인공지능(AI) 서비스 ‘키미(KIMI)’ 이미지 [출처 = 문샷AI 웹사이트 캡처]
지난 11일 등장한 중국의 거대언어모델(LLM) ‘키미(KIMI) K2’가 뛰어난 코딩 실력으로 AI 업계에서 혜성처럼 화제를 모으고 있다.
일각에서는 올해 초 파장을 일으켰던 딥시크처럼 중국 AI 스타트업이 또 한 번의 ‘딥시크 모먼트’를 가져왔다는 평가까지 나왔다.
중국 스타트업 문샷AI가 선보인 모델 ‘키미 K2’는 약 1조개의 파라미터로 구성된 대형 모델이다.
파라미터 수는 인간 두뇌의 시냅스에 해당하는 AI 모델의 논리 단위를 말한다. 숫자가 클수록 연산 능력이 강력한 것으로 풀이된다. 미국의 메타의 최신 AI 모델인 ‘라마4’ 중 가장 큰 모델이 4000억개, 딥시크의 R1 모델이 6710억개의 파라미터로 구성되어 있다.
키미 K2는 딥시크 등 주요 AI 모델들이 활용하고 있는 ‘전문가 혼합(Mixture of Experts·MoE)’ 방식을 활용함으로써 답변을 처리할 때 모든 파라미터를 사용하지 않고 해당 작업에 필요한 일부 파라미터만 사용하는 것이 특징이다. 비용 측면에서 더 효율적이다.
키미 K2의 경우 1조개의 파라미터 중 320억개의 파라미터만 활성화해 추론 작업을 수행한다.
문샷AI가 공개한 ‘키미 K2’의 주요 벤치마크 테스트 비교 표 [출처 = 문샷AI 웹사이트]
키미 K2가 주목을 받은 것은 뛰어난 코딩 역량 때문이다. 문샷AI는 “수학과 코딩 등의 분야에서 최고 수준의 성능을 달성했다”며 자사 모델과 오픈AI, 앤스로픽 등 빅테크 모델의 코딩 벤치마크를 비교한 결과를 제시했다.
문샷AI에 따르면 프로그래밍에 중점을 둔 벤치마크 SWE-벤치 베리파이드에서 키미 K2는 65.8%의 정확도를 기록하며 앤스로픽의 ‘클로트 4 오푸스(72.5%)’ 다음으로 2위를 기록했다.
또 다른 코딩 성능 평가 벤치마크인 라이브코드벤치(LiveCodeBench)에서는 53.7% 정확도로 앤스로픽(47.4%), 오픈AI(44.7%)를 모두 제치고 1위를 기록했다.
또한 키미 K2는 상업적인 이용도 가능하게끔 모델이 공개되었다. 일부 코드와 가중치를 공개한 오픈웨이트 모델로, 허깅페이스 등을 통해 다른 기업이나 개인들도 내려받아 자유롭게 사용할 수 있다.
네이선 램버트 앨런 AI 연구소 연구원은 자신의 뉴스레터에서 키미 K2에 대해 “또 다른 딥시크 모먼트가 될 것”이라며 “서구권의 개방형 모델과 중국의 개방형 모델간 격차는 점점 더 커지고 있다. 미국 오픈소스 대표는 라마4(메타)지만 중국 기업들은 딥시크, 문샷AI, 큐원 등 훨씬 유용한 모델들을 선보였다”라고 분석했다.
칭화대 출신 92년생 양즈린이 창업
문샷AI의 채용 웹사이트. 중국 사명은 ‘월지암면’으로, 달의 어두운 면을 뜻하는 핑크 플로이드의 앨범 이름에서 영감을 받았다. [출처 = 문샷AI 웹사이트 캡처]
AI 모델 키미 K2를 개발한 문샷AI는 지난 2023년 3월 설립된 2년 남짓한 신생 스타트업이다.
설립 초기부터 뛰어난 기술력으로 주목받으며 창업 11개월 만인 2024년 2월 기업가치 25억 달러를 인정받으며 유니콘 기업으로 등극했다. 현재는 지푸AI, 바이촨, 미니맥스와 함께 중국 AI 분야의 ‘4대 호랑이’로 꼽히는 핵심 플레이어다.
지난해 2월에는 알리바바 주도로 무려 10억달러(약 1조3900억원)의 대규모 투자를 유치했다. 이는 중국 AI 스타트업 역사상 단일 투자 유치 최대 규모로, 중국 시장에서 문샷AI에 대한 기대를 한 번에 증명했다.
이후 6개월 뒤에는 텐센트 또한 문샷AI에 투자를 단행했으며, 당시 문샷AI의 기업가치는 약 33억달러(약 4조5900억원)까지 상승했다.
문샷AI의 초고속 성장을 이끄는 인물은 1992년생의 천재 개발자 양지린 대표다.
양 대표는 중국 최고 명문대 칭화대를 거쳐 미국 카네기멜론대에서 박사 학위를 취득했으며, 박사 과정 중 구글 브레인과 메타 연구원으로도 활동했다.
특히 양 대표는 현재 대부분의 LLM이 사용하는 트랜스포머(Transformer) 아키텍처가 고정된 길이의 텍스트만 처리할 수 있었던 한계를 극복해 AI가 한 번에 더 긴 맥락(컨텍스트)을 이해할 수 있도록 하는 논문을 발표하며 주목을 받았다. 해당 기술은 문샷AI의 핵심 기반 기술로, 키미는 한번에 한자 기준 200만자를 처리할 수 있다.
범용인공지능(AGI) 도달을 목표로 하고 있는 양 대표는 한 현지 인터뷰에서 “컨텍스트 길이가 10억 개라면 오늘날의 문제 중 어떤 것도 문제로 남지 않을 것”이라며 AGI에 대한 자신감을 보인 바 있다.
한편 문샷AI의 중국 기업명은 달의 어두운 면을 뜻하는 ‘월지암면’으로, 양 대표가 좋아하는 밴드 핑크 플로이드의 앨범 이름에서 따왔다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
매주 일요일 밤 0시에 랭킹을 초기화합니다.