로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
서울 시내버스 '무기한 파업'…출·퇴근길 교통대란 우려
N
[IT뉴스]
체크포인트 "한국, 보안통합 수준 낮고 패치 지연 구조적 한계"
N
[IT뉴스]
"미래 아닌 현실"‥엔비디아·구글이 먼저 찜한 '꿈의 에너지'
N
[IT뉴스]
[디지털자산법 어디로]①또 '본말전도'…속타는 가상자산시장
N
[IT뉴스]
애플, 시리에 구글 '제미나이' 적용… 알파벳 시총 4조달러 돌파
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[실시간뉴스]독자 AI 경쟁 과열…연이은 논란에 '진흙탕 싸움'(종합)
온카뱅크관리자
조회:
9
2026-01-12 22:40:43
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">큐웬과 유사한 숫자 처리 방식 논란…기술 해석 엇갈려<br>네이버 "문자 토큰화는 자체 방식, 숫자만 최적화"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="pwzoGod8tW"> <p contents-hash="1368ad365ddd07d4913f49ce8000c4ea54391e9bd488d6752da91c1e4ab240b9" dmcf-pid="UrqgHgJ6Hy" dmcf-ptype="general">(서울=연합뉴스) 오지은 기자 = 정부의 독자 인공지능(AI) 파운데이션 모델 사업 선정을 놓고 경쟁이 과열되면서 연이은 논란으로 진흙탕 싸움이 벌어지고 있다.</p> <p contents-hash="0b4e6341ffb3803c7d35e4a811fa09d47d312b0d6585f1072579d416687609dd" dmcf-pid="umBaXaiPHT" dmcf-ptype="general">이번에는 독자 AI 정예팀 중 한 곳인 네이버가 중국 알리바바 큐웬(Qwen) 모델과 동일한 숫자 처리 접근 방법을 적용했다는 주장이 일각에서 제기되면서 의견이 엇갈리고 있기 때문이다.</p> <figure class="figure_frm origin_fig" contents-hash="51c45794fafba0fb92d09376697919dec40f92c2481a311c4c5f7ee1bad5a0b1" dmcf-pid="7sbNZNnQYv" dmcf-ptype="figure"> <p class="link_figure"><img alt="네이버 테크리포트 상 토크나이저 설명 [테크리포트 캡처. 재판매 및 DB 금지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/12/yonhap/20260112212246337xpeu.jpg" data-org-width="500" dmcf-mid="0aNHPHTs5Y" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/12/yonhap/20260112212246337xpeu.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 네이버 테크리포트 상 토크나이저 설명 [테크리포트 캡처. 재판매 및 DB 금지] </figcaption> </figure> <p contents-hash="59523cf511ac551c3c9b71fc72d964b0c5062e1f7351c89ba97fe5a810ada259" dmcf-pid="zOKj5jLxHS" dmcf-ptype="general">12일 네이버의 독자 AI 파운데이션 모델인 하이퍼클로바 X 32B 싱크 모델의 테크 리포트에 따르면 네이버는 토큰화 과정에서 메타의 라마(LLaMA)와 알리바바의 큐웬(Qwen)의 숫자 처리 접근방법을 동일하게 적용한 것으로 알려졌다.</p> <p contents-hash="627d90370981118c165592cb49b59ed5cc07ffc82186781b7f7c9f91c5bfe7e3" dmcf-pid="qI9A1AoMGl" dmcf-ptype="general">먼저 토큰은 AI 모델이 텍스트를 이해할 수 있는 가장 작은 단위로, 토크나이저는 문장이나 단어를 토큰으로 쪼개는 도구를 의미한다.</p> <p contents-hash="ec9a8cb1c33b82375197ace16ebb0c000a62edfdadc1f43e043bffedc4ab5c1e" dmcf-pid="BujXQXyOth" dmcf-ptype="general">네이버클라우드는 "라마나 큐웬의 토크나이저를 가져다 쓴 것은 아니다"라고 일축했다.</p> <p contents-hash="3a39d917110b98e8b243cb656c2c268e2486649829c55a4848c6b04fc9c39c59" dmcf-pid="b7AZxZWIYC" dmcf-ptype="general">네이버클라우드는 "테크 리포트에 언급된 내용은 숫자를 한 자리씩 토큰화하는 방식을 의미한다"라며 "라마와 큐웬 방식을 적용한 이유는 코드와 수학 문제에서 숫자와 연산 기능이 향상되기 때문이다"라고 전했다.</p> <p contents-hash="7fe49052911a447c660874a044a6ccaeb7504bed4bc04c09b2e3d03b71baff77" dmcf-pid="Kzc5M5YC5I" dmcf-ptype="general">아울러 "문자의 토큰화는 모델 성능의 최적화를 위해 자체적인 방식을 채택해 사용했다"라고 덧붙였다. </p> <p contents-hash="6229a404930081d3d31c6d26cfa3871c2970f7abeb8a747b6d347a1f898db31a" dmcf-pid="9qk1R1GhGO" dmcf-ptype="general">예컨대 숫자 '12345'를 처리할 때 1, 2, 3, 4, 5로 각 숫자를 개별 토큰으로 처리하는 게 라마와 큐웬 방식이라면 네이버클라우드가 이를 동일하게 적용했다는 의미로 볼 수도 있다.</p> <p contents-hash="8758e59dfbb65cdb34bc8e5101024f84b5b30c2dff52fd1ee10f8777469dad89" dmcf-pid="2BEtetHlGs" dmcf-ptype="general">네이버클라우드에 따르면 숫자를 토큰화하는 방식에는 한자리씩 토큰화하는 싱글디짓과 묶어서 토큰화하는 멀티디짓 두가지 방식이 있는데 네이버클라우드의 경우 전자를 사용한 것이다. </p> <p contents-hash="68f132675c37f920e7fcd5e1d2d8b32ec27ebff058c78113939bc6a1d5bc57af" dmcf-pid="VbDFdFXSGm" dmcf-ptype="general">다만 이 경우 후자를 사용한 경우보다 언어적 맥락을 반영하는 데 덜 직관적일 수 있다는 지적이 제기될 수 있다.</p> <p contents-hash="64f2cd9859861e584d254875a6c584648537680a747211cfd85fdffe0ba1eda8" dmcf-pid="fKw3J3ZvXr" dmcf-ptype="general">예를 들어 '20260112'라는 숫자가 있다면 싱글디짓은 2,0,2,6,0,1,1,2로 숫자를 쪼개 2026,01,12로 쪼개는 멀티 디짓 방식보다 날짜라는 언어적 맥락을 캐치하는 데 더 많은 추론 노력이 들어간다.</p> <p contents-hash="65d4e42f7ec2d53c768fc6515ffc7822db81a29ee46688e6d452c0e222f04a9b" dmcf-pid="49r0i05Ttw" dmcf-ptype="general">AI 업계 관계자는 "수학이나 과학 영역에서는 자릿수 단위로 자르는 게 (추론에) 유리하기 때문에 이러한 토큰화 방식을 적용하는 경우가 있다"고 설명했다.</p> <p contents-hash="a3dbaa14b2e2f7bd0c47c2fc436eb6b62518b8c811c2a77a9bfccaea1bcd84f1" dmcf-pid="82mpnp1yHD" dmcf-ptype="general">정부는 독자 AI 사업 정예팀 5곳의 AI 모델 평가를 마친 뒤 오는 15일 1차 탈락 컨소시엄을 발표할 예정이다.</p> <p contents-hash="cc483e0fea171e69f51043cdb46c5e6e1a8510e01dcb38597a38cfe585f609f0" dmcf-pid="6VsULUtW1E" dmcf-ptype="general">built@yna.co.kr</p> <p contents-hash="9e84dd9f2890bce57e48114fbc43a6569500763187bc90e89345946644b8b0a1" dmcf-pid="QUNHPHTsZc" dmcf-ptype="general">▶제보는 카톡 okjebo</p> </section> </div> <p class="" data-translation="true">Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기