"라마4 스카우트, 큐원2.5 72B보다 벤치마크 성능 우위"
솔라 프로2 벤치마크 비교(업스테이지 제공)
(서울=뉴스1) 윤주영 기자 = 업스테이지(486550)는 자사의 차세대 거대언어모델(LLM) '솔라 프로 2'의 프리뷰 버전을 20일 공개했다.
솔라 프로 2는 지난해 12월 출시된 '솔라 프로'의 후속으로, 모델 매개변수(파라미터)는 기존 220억 개에서 310억 개로 확대되고 성능도 대폭 늘었다. 업스테이지는 올해 7월 정식 출시에 앞서, 초기 테스트용으로 프리뷰 응용 프로그램 인터페이스(API)를 무료로 사용할 수 있도록 공개했다.
솔라 프로 2는 종합 지식(MMLU), 지시 이행(IFEval) 등 주요 LLM 벤치마크 성능 평균에서 메타의 '라마 4 스카우트'·'라마 3.3 70B', 알리바바의 '큐원 2.5 72B' 등 두 배 이상 큰 빅테크 모델들을 앞질렀다.
또 'KMMLU'·'해례'(HAE-RAE) 등 한국어 성능을 평가하는 대표 벤치마크에서 높은 점수를 기록, 현재 공개된 소형언어모델 중 가장 뛰어난 수준임을 입증했다. 고품질 한국어 데이터를 학습에 적극 활용한 것이 주효했다.
아울러 솔라 프로 2에는 업스테이지 LLM 최초로 '하이브리드 모드'가 적용된다. 모델 사용 시 빠른 응답에 최적화된 '챗 모드'와, 단계적 사고를 거쳐 구조화한 답변을 생성하는 '추론 모드' 중 선택할 수 있다.
추론 모드에는 '생각 사슬'(Chain of Thought, CoT) 기법이 적용, 수학이나 코딩처럼 복잡한 문제에서 더욱 정교한 답변을 제공한다.
사용성도 강화됐다. 기존보다 2배 확장된 6만 4000 토큰까지 지원해 더 긴 문서나 대화를 한 번에 처리할 수 있다. 자체 토크나이저(tokenizer) 개선을 통해 한국어 및 문서 기반 작업에서 최대 30%까지 토큰 절감이 가능해졌으며, 이에 따라 응답 속도와 비용 효율도 대폭 향상됐다
김성훈 업스테이지 대표는 "솔라 프로 2는 310억 개의 비교적 소규모 파라미터로도 700억 개 파라미터 모델 수준의 성능을 구현한다"며 "추론과 한국어 성능이 뛰어난 만큼 많은 업무를 혁신할 수 있을 것"이라고 말했다.
legomaster@news1.kr
<용어설명>
■ API API는 응용프로그램 인터페이스(Application Programming Interface)로 하나의 소프트웨어 컴포넌트가 다른 소프트웨어 컴포넌트와 상호작용할 수 있도록 설계된 인터페이스다. 즉, 소프트웨어끼리 서로 정보를 주고받고 기능을 사용하게 해주는 중간다리다.
■ LLM 거대 언어 모델(LLM)이란 서술형 질의 응답부터 채팅, 콘텐츠 요약, 임의에 가까운 명령 실행, 번역, 콘텐츠 및 코드 생성에 이르기까지 다양한 작업에서 우수한 성능을 보여주는 자연어 처리(NLP) 모델을 의미한다.. LLM은 인간 언어의 패턴과 구조를 학습하기 위해 고급 머신 러닝 알고리즘을 사용한다. 방대한 데이터 세트가 학습에 투입된다.
■ 생각 사슬 인공지능(AI) 언어모델이 단계별로 사고를 수행하는 방식. 복잡한 질문에 한 번에 답변하지 않고, 중간 과정을 출력하면서 최종 답변에 도달하는 것이다. 명령어(프롬프트) 엔지니어링이 간소화되고, 언어모델이 더 많은 노력을 집중할 위치를 알 수 있게 된다.
Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.