로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
尹 편에 섰던 '민중의 지팡이'… 혈세 14조원과 경찰 자화상 [視리즈]
N
[실시간뉴스]
"계엄선포 때 김건희, 尹과 심하게 싸워…'다 망쳤다' 분노"
N
[IT뉴스]
스타링크·중국 위성, 충돌할 뻔…"200m까지 접근" [우주로 간다]
N
[연예뉴스]
'메이드 인 코리아' 우민호 감독 “제작비 700억 원? 돈이 좀 들어갔다”
N
[연예뉴스]
美 언론, '아이딧' 집중 조명…"2026년 뒤흔들 신인그룹"
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]'국가대표 AI' 기존 모델 5종, 수능 수학·수리논술 풀이서 해외와 격차
온카뱅크관리자
조회:
11
2025-12-15 10:07:35
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">서강대 김종락 교수팀, 국내외 AI 10개 모델 수학 성능 비교…"신버전 나오면 재평가"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="fx25VKlwJs"> <figure class="figure_frm origin_fig" contents-hash="448030782f23fb688b7e03566adf4c32261bb87cbe0185418a87ca9597de89dd" dmcf-pid="4e4F8VTsnm" dmcf-ptype="figure"> <p class="link_figure"><img alt="서강대 연구팀이 국내외 AI 10개 모델의 수학 문제 풀이 능력을 평가한 결과 국내 모델은 해외 모델과 큰 격차를 보였다. 게티이미지뱅크 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/15/dongascience/20251215100140093udon.jpg" data-org-width="680" dmcf-mid="9IgiOr4qdC" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/15/dongascience/20251215100140093udon.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 서강대 연구팀이 국내외 AI 10개 모델의 수학 문제 풀이 능력을 평가한 결과 국내 모델은 해외 모델과 큰 격차를 보였다. 게티이미지뱅크 제공 </figcaption> </figure> <p contents-hash="0b29c818f8e03eca13082d7ce01494ea66c2683299f30f584ea48e5551f51bf0" dmcf-pid="8d836fyOJr" dmcf-ptype="general">정부가 추진하는 '국가대표 AI' 프로젝트 참여사들의 기존 공개 모델이 수학 문제 풀이에서 해외 모델과 큰 격차를 보였다.</p> <p contents-hash="d9178c3af97018366280568ab9e6ae6cf2a4e7a00caacf0452d7be2b7738cf69" dmcf-pid="6J60P4WIiw" dmcf-ptype="general">정부는 해외 모델 종속을 막기 위해 자국 데이터·인프라·인력으로 독자 개발하는 인공지능인 '소버린 AI(Sovereign AI)' 확보에 힘쓰고 있다. 지난 8월 네이버클라우드, 업스테이지, SK텔레콤, NC AI, LG AI연구원 등 5개 컨소시엄을 정예팀으로 선정했다. 2026년 내 글로벌 10위권 진입이 목표다.</p> <p contents-hash="247929ce4bc872bcc3da1b84eb134462fc0ded9a147a36d417c03bcb56efb779" dmcf-pid="PiPpQ8YCdD" dmcf-ptype="general">김종락 서강대 수학과 교수 연구팀(CICAGO Lab)은 지난 12일 '생성형 AI와 수학문제 해결 및 생성 워크숍'에서 국내 5개 모델과 해외 5개 모델의 수학 문제 해결 능력을 비교한 결과를 발표했다.</p> <p contents-hash="569937e598c1cb44bbd39fca8c93c8cf0752d18885e00373ef0cd0a62c851c21" dmcf-pid="QnQUx6GhME" dmcf-ptype="general">연구팀은 대학수학능력시험(수능) 수학 공통과목, 확률과 통계, 미적분, 기하에서 고난도 문항 5개씩을 뽑아 20문제를 만들었다. 국내 10개 대학 논술 기출 10문제, 인도 대학입시 10문제, 일본 도쿄대공대 대학원 입시 수학 10문제를 더해 총 50문제를 구성했다.</p> <p contents-hash="78dfe576029b0fa110621fc507ff1893aa17b445e6e2db5a21f44b08d008538f" dmcf-pid="xLxuMPHlLk" dmcf-ptype="general">국내 모델은 업스테이지 '솔라 프로 2', LG AI연구원 '엑사원 4.0.1', 네이버 '하이퍼클로바-007', SK텔레콤 '에이닷 엑스 4.0(72B)', 엔씨소프트 경량 모델 '라마-바르코 8B 인스트럭트'를 활용했다.</p> <p contents-hash="e8c231e5b7953d655e457da88c0d9864f51af797465999457abe5acb806a53d1" dmcf-pid="y1ycWvd8Lc" dmcf-ptype="general">해외 모델은 오픈AI 'GPT-5.1', 구글 '제미나이 3 프로 프리뷰', 앤스로픽 '클로드 오퍼스 4.5', xAI '그록 4.1 패스트', 딥시크 '딥시크 V3.2'와 비교했다.</p> <p contents-hash="266e5191d97ffb3e32999de5daea8660ea7c68e730c434c417227571f2a07a87" dmcf-pid="WtWkYTJ6RA" dmcf-ptype="general">해외 모델은 76~92% 정답률을 기록했다. 제미나이 3 프로가 46문제를 맞혀 92%로 1위를 차지했다. 클로드 오퍼스 4.5가 84%, 그록 4.1 패스트가 82%, GPT-5.1이 80%, 딥시크 V3.2가 76%를 기록했다. 일반적으로 성능이 가장 우수하다고 알려진 GPT-5.1은 4위에 그쳤다.</p> <p contents-hash="bfa4d25589348ca6d35a70c6618db0b969251f3c5af825889ef239f291aea592" dmcf-pid="YFYEGyiPdj" dmcf-ptype="general">국내 모델은 솔라 프로 2만 50문제 중 29문제를 맞혀 정답률 58%를 기록했다. 하이퍼클로바X-007은 13문제를 맞혀 26%, 엑사원 4.0.1과 에이닷 엑스 4.0은 각각 12문제를 맞혀 24% 정답률을 기록했다. 라마-바르코 8B 인스트럭트는 1문제만 맞혀 2%에 머물렀다.</p> <p contents-hash="326849cf6e531edc1df42e17e8d79c6dd05106a991f85fda99c06b41286946dd" dmcf-pid="G3GDHWnQRN" dmcf-ptype="general"> 연구팀은 국내 모델이 단순 추론으로는 문제 대부분을 풀지 못해 파이썬을 도구로 활용하도록 설계했다고 밝혔다. 파이썬을 활용해도 해외 모델과 격차가 컸다.</p> <figure class="figure_frm origin_fig" contents-hash="fd95d475751b2b9affe218d108d2358dccec7d348a32cd3115431b0f6bf569f4" dmcf-pid="H0HwXYLxia" dmcf-ptype="figure"> <p class="link_figure"><img alt="수능·논술 포함 50문제, 국내외 모델 정답률 비교,. 서강대 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/15/dongascience/20251215100141364xqid.png" data-org-width="328" dmcf-mid="2LmJswfzLI" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/15/dongascience/20251215100141364xqid.png" width="658"></p> <figcaption class="txt_caption default_figure"> 수능·논술 포함 50문제, 국내외 모델 정답률 비교,. 서강대 제공 </figcaption> </figure> <p contents-hash="672f249294b1d85e250f5ab85267c6191757c22dcbd9b5c549be39889f264239" dmcf-pid="XpXrZGoMRg" dmcf-ptype="general">연구팀은 50문제 평가에서 국내 3개 모델, 하이퍼클로바X-007, 엑사원 4.0.1, 에이닷 엑스 4.0의 성능 차이가 거의 없어 자체 개발 문제로 추가 평가를 진행했다. 대학교 수준부터 교수급 논문 연구 수준까지 난이도를 나눈 '엔트로피매스(EntropyMath)' 100문제 중 10문제를 선별했다. 올림피아드 출신 교수와 전공 분야 교수들이 문제를 검수했다.</p> <p contents-hash="03342c1b9552b373b4651db5dd1fb5e659203dac8d499622af794ebc68647060" dmcf-pid="ZDgfaLUZno" dmcf-ptype="general">해외 모델은 정답률 82~90%를 기록했다. 국내 모델은 7.1~53.3%였다. 같은 문제를 3번까지 풀어 한 번이라도 맞히면 정답으로 인정하는 기준을 적용하자 그록 4.1 패스트가 100%를 달성했다. 나머지 해외 모델도 90%를 기록했다. 국내 모델은 솔라 프로 2가 70%, 엑사원 4.0.1이 60%, 하이퍼클로바X-007이 40%, 에이닷 엑스 4.0이 30%, 라마-바르코 8B 인스트럭트가 20%였다.</p> <figure class="figure_frm origin_fig" contents-hash="8fd369537ab9d872a1123108c21c3e263749baac7caa6e26cdbb61545c598f60" dmcf-pid="5wa4Nou5eL" dmcf-ptype="figure"> <p class="link_figure"><img alt="자체 제작 데이터세트(엔트로피매스)에 대한 국내외 모델 정답률 비교. 서강대 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/15/dongascience/20251215100142595kwpz.png" data-org-width="638" dmcf-mid="Vf5s1XaeiO" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/15/dongascience/20251215100142595kwpz.png" width="658"></p> <figcaption class="txt_caption default_figure"> 자체 제작 데이터세트(엔트로피매스)에 대한 국내외 모델 정답률 비교. 서강대 제공 </figcaption> </figure> <p contents-hash="78160d6b344052087c4c6a9071c0ce55e06168ef85022bcb25acb157ba0b6138" dmcf-pid="1rN8jg71Mn" dmcf-ptype="general">김종락 서강대 교수는 "주위에서 왜 수능 문제에 대한 국내 소버린 AI 모델 평가가 없는지 문의가 많아 팀원들과 테스트를 진행했다"며 "현재 공개된 모델 기준으로 해외 선도 모델과 격차가 있다"고 말했다.</p> <p contents-hash="1216b0dcc4448da67c12cb9fca3cb65066cdb5dbdf4bb10f33b682b4bba432e6" dmcf-pid="tmj6AaztLi" dmcf-ptype="general"> 평가에 사용한 국내 5개 모델은 기존 공개 버전이다. 정부 지원을 받아 개발 중인 신규 모델은 아직 나오지 않았다. 연구팀은 새 버전이 공개되면 다시 테스트할 계획이다.</p> <p contents-hash="0ddd6352c5f8675bfe15d04e76f522a5ca028e86d54ae36b925e52b822dd64bf" dmcf-pid="FsAPcNqFnJ" dmcf-ptype="general"> 김 교수는 "엔트로피매스 데이터세트를 기반으로 수학 리더보드를 개설했다"며 "국제적 수준으로 키우겠다"고 밝혔다. 이어 "문제 생성 알고리즘을 개선해 수학뿐 아니라 과학, 제조, 문화 분야 데이터세트를 만들겠다"고 덧붙였다.</p> <p contents-hash="2b60e52ce8d555d6daa3e26650d95f1846b7672949b38500e004bb1f87893863" dmcf-pid="3OcQkjB3Jd" dmcf-ptype="general">서강대 수리과학 및 데이터사이언스 연구소(IMDS)와 딥파운틴이 연구를 공동 지원했다. 상세 결과는 entropymath.com에서 볼 수 있다.</p> <p contents-hash="53bb28bcb46751ff8f399c9d863cf99fe84695b9f8df17db844745af385e3a63" dmcf-pid="0IkxEAb0Le" dmcf-ptype="general">[조가현 기자 gahyun@donga.com]</p> </section> </div> <p class="" data-translation="true">Copyright © 동아사이언스. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기