로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
오만석, 싱글대디 10년 상처→알던 후배와 재혼 “애처가 됐다” 증언(데이앤나잇)[결정적장면]
N
[연예뉴스]
송승환, 강수지 잭팟→박진영 현빈은 놓쳤다 “그 얼굴로 가수? 연기 부족”(데이앤나잇)
N
[스포츠뉴스]
반전 또 반전! 韓日전서 충격 결말...일본, 세계 랭킹 5위 듀오, 한국 배드민턴에 또다시 완패 "이소희-백하나 조에 무력화"
N
[연예뉴스]
야노 시호, '50억 도쿄집' 산 이유 있었네…"한국 활동, 日 급여 2~3배"('전참시')
N
[연예뉴스]
엔하이픈 '골디 음원본상 축하해요!'[★영상]
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]독자 AI가 뭐길래…업스테이지가 내놓은 ‘프롬 스크래치’ 설명 3가지
온카뱅크관리자
조회:
27
2026-01-04 08:47:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">① 프롬 스크래치 판정 기준은 ‘가중치의 랜덤 초기화’ 여부<br>② 과거 모델(솔라 프로2)과 성격 달라<br>③ 극히 일부 지표만 보고 ‘베끼기’ 단정 해석은 경계해야</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="tbsDd5sAwF"> <p contents-hash="a3a7cf4fb64f3ab03d82c8c475e8520151a690427144ff3fc45d8f52531a0eb5" dmcf-pid="FKOwJ1OcEt" dmcf-ptype="general"> [이데일리 김현아 기자] 정부가 2000억원을 지원하는 ‘독자 AI 파운데이션 모델’ 과제를 둘러싸고 베끼기 공방이 불거지면서, 독자 AI 모델인지 여부를 가르는 ‘프롬 스크래치(From Scratch)’ 기준에 관심이 쏠리고 있다. </p> <p contents-hash="2ee353c0da52f87f96e36905b26d3f368ce9631e7ce77f3be4173430a20c5f11" dmcf-pid="39IritIkI1" dmcf-ptype="general">새해 벽두부터 ‘독자 AI 파운데이션 모델’ 후보로 거론되는 업스테이지의 ‘솔라 오픈 100B’를 두고 “중국 모델을 베낀 것 아니냐”는 논란이 제기되자, 프롬 스크래치의 의미와 판단 기준이 더 주목받는 분위기다.</p> <p contents-hash="b898bcc6387cddbd3bb5799cca6d0ae786d5e4123228c9030248497cf43e1427" dmcf-pid="02CmnFCEs5" dmcf-ptype="general">프롬 스크래치는 AI 모델의 가중치(웨이트)를 ‘빈 상태’에서 랜덤으로 초기화한 뒤, 그 상태에서 처음부터 끝까지 새로 학습해 만든 모델을 뜻한다. 반대로 누군가가 이미 학습해 둔 가중치를 일부라도 가져와 이어서 학습했거나, 실행(추론) 단계에서 다른 모델 가중치를 불러와 섞어 쓰는 경우는 프롬 스크래치로 보기 어렵다.</p> <figure class="figure_frm origin_fig" contents-hash="d502361ce64cb30e42e98f515928dda9e839df27ba165c021015bd8c79acf399" dmcf-pid="pVhsL3hDsZ" dmcf-ptype="figure"> <p class="link_figure"><img alt="김성훈 업스테이지 대표가 2일 강남오피스에서 업계 및 정부 관계자 70여 명 대상으로 현장 설명을 하고 있다(사진=윤정훈 기자)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/04/Edaily/20260104084406363iwtv.jpg" data-org-width="566" dmcf-mid="ZPhMqmJ6mp" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/04/Edaily/20260104084406363iwtv.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 김성훈 업스테이지 대표가 2일 강남오피스에서 업계 및 정부 관계자 70여 명 대상으로 현장 설명을 하고 있다(사진=윤정훈 기자) </figcaption> </figure> <div contents-hash="25323ad678b1ccfcf7c53cee082b3d72e08d7df5274dad959d4535c446d6e862" dmcf-pid="UJ5Gr25TEX" dmcf-ptype="general"> 업스테이지 김성훈 대표는 지난 2일 공개 검증회를 열고 “독자 파운데이션 모델 논쟁의 핵심은 구조가 아니라 가중치”라며, 체크포인트와 학습 로그 등 학습 과정을 근거로 “솔라 오픈 100B는 파생이 아니라 프롬 스크래치로 만든 모델”이라고 설명했다. 논란 과정에서 불거진 추론(인퍼런스) 코드 라이선스 표기 문제에 대해서는 “실수였다”고 인정하며, 수정 배경과 향후 일정도 함께 공개했다. </div> <p contents-hash="ca8655efd49fad112c22ff486b9c90e47f57ddc15e18fc71d6ba2fb95cafd622" dmcf-pid="ui1HmV1ysH" dmcf-ptype="general">김 대표가 이날 강조한 설명은 크게 세 갈래다.</p> <p contents-hash="2629d02ba27700ec63eceeab6b660dbbe10573ace28734c48a655aab10ff5e31" dmcf-pid="7ntXsftWOG" dmcf-ptype="general"><strong>① 프롬 스크래치 판정 기준은 ‘가중치의 랜덤 초기화’ 여부</strong></p> <p contents-hash="8fb6be71301f03be5827cac6cdfcd6ab2a20bd0a1b1fbd81171ee79a4f8ea986" dmcf-pid="zLFZO4FYmY" dmcf-ptype="general">김 대표는 프롬 스크래치를 가르는 결정적 기준으로 ‘가중치(웨이트)’를 꼽았다. 가중치를 랜덤하게 초기화한 뒤 처음부터 새로 학습했는지, 아니면 아주 일부라도 다른 사람이 학습한 가중치를 가져와 이어서 학습했는지가 핵심이라는 설명이다.</p> <p contents-hash="8fd99d86ebb347fbb0450de026bc4167723c58eb94958afb20b02391156cdba2" dmcf-pid="qo35I83GwW" dmcf-ptype="general">그는 트랜스포머와 MoE(혼합전문가) 계열 구조가 사실상 표준화돼 있어, 모델 구조가 비슷하거나 오픈소스 라이브러리를 썼다는 이유만으로 독자성을 부정하기는 어렵다고 말했다. 허깅페이스 등 오픈소스 생태계를 활용하는 것은 자연스러운 일이며, 기여(컨트리뷰션)를 통해 생태계를 확장하는 선순환이 더 중요하다는 취지다.</p> <p contents-hash="1df0ebe7d954b7050f5d4c66d1ef5029d4732d589ba166e8fa9fdaf5a2a1c60e" dmcf-pid="Bg01C60Hry" dmcf-ptype="general">그렇다면 프롬 스크래치를 어떻게 입증할 수 있을까. 김 대표는 체크포인트와 학습 로그를 근거로 제시했다. 학습 과정에서 일정 스텝마다 저장된 체크포인트와 W&B(Weights & Biases) 같은 학습 추적 로그를 ‘육아일기’에 비유하며 “처음부터 학습했다는 흔적은 남아 있고 보여줄 수 있다”고 했다. 실제로 업스테이지는 로스(loss) 변화와 MMLU 등 성능 지표가 학습 기간(9월 초~11월 말) 동안 어떻게 변했는지 확인할 수 있는 추적 데이터도 공개했다.</p> <p contents-hash="838ed9eb3ab96db25d5628285af78b0e4c30e3083762ca9f9a13f599540e7ff9" dmcf-pid="bapthPpXsT" dmcf-ptype="general"><strong>② 과거 모델(솔라 프로2)과 성격 다르다…“3개월간 GPU 500대 지원받아 처음부터 만들었다”</strong></p> <p contents-hash="89ff3358acfa9a66406e7fc2b457c6ee4ec8968d0ea6d2a3b1db501bdb2b1d08" dmcf-pid="KNUFlQUZIv" dmcf-ptype="general">김 대표는 “솔라 오픈 100B를 예전 모델인 ‘솔라 프로2’와 같은 기준으로 비교하는 건 오해”라고 말했다. 업스테이지는 과거 모델들에 대해 “처음부터 새로 학습했다(프롬 스크래치)”고 주장한 적이 없다는 점도 분명히 했다.</p> <p contents-hash="62b30637c6bf87a03aad2dbb789a45261cea1082482cb3b182dfaff1391655ae" dmcf-pid="9ju3Sxu5sS" dmcf-ptype="general">그에 따르면 솔라 프로2는 미스트랄 같은 기존 모델을 바탕으로, 비용과 시간을 줄이기 위한 방식(뎁스 업스케일링 등)으로 만든 모델이다. 스타트업 입장에선 처음부터 완전히 새로 학습할 만큼 자원과 여력이 부족했던 시기라는 설명이다.</p> <p contents-hash="39cfef374ae75f50e7f73cc675acd3e0a2ce804313fcf616b23d9828000ca87e" dmcf-pid="2bsDd5sAwl" dmcf-ptype="general">반면 솔라 오픈 100B는 출발부터 다르다. 국가 프로젝트로 ‘독자 파운데이션 모델’을 만들자는 목표 아래 추진됐고, 9월부터 11월까지 3개월 동안 GPU 약 500대를 지원받아 학습을 진행했다고 밝혔다. 김 대표는 “이번 과제는 ‘처음부터 만들었는지’가 핵심인 만큼, 검증 기준도 더 엄격할 수밖에 없다”고 했다.</p> <p contents-hash="3a28f0fee8d1eef143f12e804668353fe5c51036718ef0f794cfdabfaebf8d4c" dmcf-pid="VKOwJ1OcIh" dmcf-ptype="general">또 그는 “상업적으로는 기존 모델을 가져와 추가 학습하거나(컨티뉴드 프리트레이닝), 목적에 맞게 다듬는 방식(파인튜닝)도 충분히 좋은 방법”이라면서도, 이번 과제는 애초 목표가 ‘독자 모델’이어서 접근이 다르다고 구분했다.</p> <figure class="figure_frm origin_fig" contents-hash="dbb2d94506091a141e39ff3b798126f7b83b1ceeb6bb10dc434ff84d51948c75" dmcf-pid="f9IritIkIC" dmcf-ptype="figure"> <p class="link_figure"><img alt="김성훈 업스테이지 대표가 2일 강남오피스에서 업계 및 정부 관계자 70여 명 대상으로 현장 설명을 하고 있다(사진=윤정훈 기자)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/04/Edaily/20260104084407603tyki.jpg" data-org-width="543" dmcf-mid="1GNLfSNdw3" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/04/Edaily/20260104084407603tyki.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 김성훈 업스테이지 대표가 2일 강남오피스에서 업계 및 정부 관계자 70여 명 대상으로 현장 설명을 하고 있다(사진=윤정훈 기자) </figcaption> </figure> <div contents-hash="cd500a8e4c767339f1c98b3351ad8552cc22c3131c82df5f0c99377adc552338" dmcf-pid="42CmnFCErI" dmcf-ptype="general"> <strong>③ 극히 일부 지표만 보고 ‘베끼기’로 단정하는 해석은 경계해야</strong> </div> <p contents-hash="219a941429cd3bfbe1b281cf925f1eebaa302124046827deae42faa902dd0fa0" dmcf-pid="8VhsL3hDsO" dmcf-ptype="general">김 대표는 논란의 출발점이 된 레이어 정규화(LayerNorm) 유사성 지표와 관련해 “코사인 유사도는 숫자의 ‘방향’만 보고 ‘크기’는 무시한다”고 설명했다. LayerNorm 파라미터는 특성상 값이 비슷해 보일 수 있어, 특정 지표만으로 “가중치를 공유했다”는 결론을 내리기 어렵다는 취지다.</p> <p contents-hash="9437aba412e562f00708ac2078c54e3542c62093818297a5a6e92ca613c0b539" dmcf-pid="6flOo0lwOs" dmcf-ptype="general">그는 문제로 지목된 값이 모델 전체 파라미터 중 극히 일부에 불과하고, 비교 방식 자체에도 오류가 있었다고 반박했다. 내부 레이어끼리 비교해도 유사도가 높게 나오는 사례를 들어 “그 수치 하나만으로 베끼기를 단정하기는 무리”라고 말했다.</p> <p contents-hash="c35e6b74cad6dc7273e60d9bf67330a636b287c5058b4627ac3ed94fb5649b26" dmcf-pid="P4SIgpSrsm" dmcf-ptype="general">또 다른 쟁점이 된 추론(인퍼런스) 코드 논란에 대해서는 실수를 인정했다. </p> <p contents-hash="4df6973cd224a095ab9d366db068175552319467d9dc9e5b53c61ff5cc1308ab" dmcf-pid="Q8vCaUvmEr" dmcf-ptype="general">김 대표는 “추론 코드는 모델 가중치(웨이트) 자체가 아니라 사용자가 편하게 돌려볼 수 있도록 함께 제공한 코드”라며, 허깅페이스 라이브러리 일부를 가져와 자사 모델 구조에 맞게 상당 부분 고쳐 썼다고 밝혔다. </p> <p contents-hash="bbeaf6d65df9e54158e44f8c7960d9dab14212c3f9a352b9932ea8cb2ed4a6f6" dmcf-pid="x6ThNuTsmw" dmcf-ptype="general">다만 아파치 라이선스를 적용하는 과정에서 원저작자 표기(중국 GLM 표기 등)를 초기에 꼼꼼히 챙기지 못했고, 이후 이를 바로잡는 과정이 ‘업데이트’처럼 보였다는 점은 인정했다. 그는 “국가 과제 요구조건상 12월 31일까지 가중치를 제출해야 했기 때문에 마지막까지 학습에 집중했고, 그 과정에서 리드미·벤치마크·부속 파일 정리는 일정상 뒤로 밀렸다”고 덧붙였다.</p> <p contents-hash="67de5734798fb49001c45778cadd40717f58da2225b774163729c0e00645e6c1" dmcf-pid="yvx8pkx2OD" dmcf-ptype="general"><strong>“1년 안에 프론티어급 모델 추격” 자신</strong></p> <p contents-hash="667dd8a895050e9088dd79faba94ac900a072f62f39de987d5d6e36189ac8d3e" dmcf-pid="WTM6UEMVOE" dmcf-ptype="general">향후 일정도 제시했다. 김 대표는 1월 4일 테크니컬 리포트와 평가 지표가 추가 공개될 예정이며, 이후에도 관련 자료와 파일이 계속 업데이트될 수 있다고 밝혔다. </p> <p contents-hash="9cb24ed692e751dd67aff52f3b60a427bc4bb2da8483f0b3e40edf40deb102b7" dmcf-pid="YyRPuDRfrk" dmcf-ptype="general">응용프로그램인터페이스(API) 공개도 일정에 따라 순차적으로 진행된다고 했다. 그는 “3개월 동안 GPU 약 500대를 투입한 경험”을 언급하며 “시간과 GPU가 더 주어진다면 1년 안에 프론티어급 모델을 따라갈 수 있다”는 자신감도 내비쳤다. 독자AI 모델의 활용 수준에 대해서는 “올림피아드에 나가기는 어려워도 일상 생활의 검색, 요약, 이메일 작성 등은 충분히 가능한 수준”이라고 말했다.</p> <p contents-hash="acdbf2100cf2f5d89d6b003094028f649c26546b6cf67577c013a8e66fa2d3a5" dmcf-pid="GWeQ7we4sc" dmcf-ptype="general">김 대표는 끝으로 “확인되지 않은 내용을 ‘빼박 증거’처럼 확정적으로 말하는 방식은 모두에게 상처를 남긴다”며, 문제 제기는 가능하지만 검증 과정과 표현의 책임이 함께 따라야 한다는 점을 강조했다. </p> <p contents-hash="85539b0e2dced3606d0e5488c70afb764f0b54556d38e584559edfa15dce52ed" dmcf-pid="HYdxzrd8sA" dmcf-ptype="general">이번 논쟁이 ‘누가 이겼나’의 문제가 아니라, 독자 파운데이션 모델의 기준과 검증 문화가 무엇이어야 하는지 되묻는 계기가 됐다는 평가다.</p> <p contents-hash="44acb9136eca5f14ef0f4b45248d5a2e66ebc7ed81fd701442e9933d460e8355" dmcf-pid="XGJMqmJ6Ij" dmcf-ptype="general">김현아 (chaos@edaily.co.kr) </p> </section> </div> <p class="" data-translation="true">Copyright © 이데일리. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기