로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
김대건의 '비극적' 순교, 이 사람과의 동행 때문이었다?
N
[연예뉴스]
'암 투병' 박미선, 공구논란 이후 근황 "건강하게 잘 지내"
N
[연예뉴스]
지성, 로펌 노예서 적폐 판사로…'판사 이한영' D-5
N
[연예뉴스]
"25살 법칙 깨졌다" 레오나르도 디카프리오, 27살 여친과 달콤 로맨스 포착[해외이슈]
N
[스포츠뉴스]
‘대박 또 대박’ 페레이라, 존스 아닌 아스피날 노린다! 헤비급 슈퍼파이트 가능성↑…UFC 해설 충격 발언 “간과 싸울 것 같다던데?”
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]UNIST, 학습 데이터에 ‘자막’ 달아 블랙박스 푼다
온카뱅크관리자
조회:
14
2025-12-28 10:57:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">LLM이 이미지 특징을 문장으로 만들고<br>영향력 점수로 ‘알짜 설명’만 골라 학습<br>데이터 선별 효율 높이고<br>멀티모달·제로샷 성능까지 끌어올리는 방법론 제시</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="31lvlThDsv"> <p contents-hash="8bc8ab593cac4aedee69274223ea32524a0a818195266a12f9313cf5ae5072bd" dmcf-pid="0FvyvWSrES" dmcf-ptype="general"> [이데일리 김현아 기자] 인공지능, 특히 딥러닝은 종종 ‘맞히긴 맞히는데 왜 맞혔는지 말은 못 하는’ 블랙박스로 불린다. 사진을 보여주면 새를 새라고 맞히지만, 도대체 사진의 어디를 보고 그렇게 판단했는지는 사람 입장에서 답답할 때가 많다. </p> <p contents-hash="b04d1ce384e42453a74b142ed1853ef4277d9773e016cea8ef8f5731190762e8" dmcf-pid="p3TWTYvmwl" dmcf-ptype="general">그동안은 모델 내부를 들여다보는 방식의 설명 가능한 인공지능(XAI)이 주류였는데, 이번엔 출발점이 다르다. 모델이 아니라 모델을 키우는 ‘데이터’에 사람 말로 된 설명을 붙여, 판단 근거를 더 투명하게 만들자는 접근이다.</p> <p contents-hash="5ae9c972b63f45c0df67bbc28332ceee2a9b0a55c4b20ba2e33ba9f93351f82c" dmcf-pid="U0yYyGTsDh" dmcf-ptype="general">울산과학기술원(UNIST)인공지능대학원 김태환 교수팀은 대형언어모델(LLM)을 활용해 이미지 데이터를 자연어 설명문으로 변환한 뒤, 그중 실제로 학습에 도움이 되는 문장만 골라 쓰는 학습 방법론을 제안했다고 28일 밝혔다. </p> <figure class="figure_frm origin_fig" contents-hash="8508ddc7e19d8e5a3e89a72f64775ef70f63a7df39fa4e622092f3bdaeb977a7" dmcf-pid="upWGWHyODC" dmcf-ptype="figure"> <p class="link_figure"><img alt="김태환 교수, 김채리 연구원(제1저자), 배재연 연구원(제1저자)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/28/Edaily/20251228105207139yxfd.jpg" data-org-width="670" dmcf-mid="1fNcjkNdDW" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/28/Edaily/20251228105207139yxfd.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 김태환 교수, 김채리 연구원(제1저자), 배재연 연구원(제1저자) </figcaption> </figure> <div contents-hash="0999b3a6aee15a904aeb6f9879dfeb165194e668f261d48cb7f31d3f75f122f7" dmcf-pid="7UYHYXWIwI" dmcf-ptype="general"> 연구팀 설명에 따르면, 핵심은 “AI가 무엇을 보고 배웠는지”를 모델의 속이 아니라 데이터의 언어로 드러내는 데 있다. </div> <p contents-hash="c29c76f7013a1c0bafe077f0af6ca666bd1b75fa3158f537ae147ac0ba0a5143" dmcf-pid="zuGXGZYCwO" dmcf-ptype="general">방법은 간단하면서도 영리하다. 먼저 LLM이 이미지(또는 클래스)의 시각적 특징을 여러 문장으로 풀어쓴다. 설명문의 품질을 높이기 위해 인터넷 백과사전 같은 외부 지식도 참고하도록 했다. 다만 LLM이 만들어낸 문장이 많다고 해서 전부 쓸모 있는 것은 아니다. 모델이 실제로 정답을 맞히는 데 기여한 문장이 따로 있기 때문이다.</p> <figure class="figure_frm origin_fig" contents-hash="d16ac18914d7c870e8d6d8bbb127af199a9ca1561898f142d0f080331b5fddc9" dmcf-pid="q7HZH5Ghws" dmcf-ptype="figure"> <p class="link_figure"><img alt="대형언어모델(LLM)을 활용한 데이터 설명문 생성 및 선별·학습 과정 개요" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/28/Edaily/20251228105208388judq.jpg" data-org-width="670" dmcf-mid="tTMeMdx2wy" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/28/Edaily/20251228105208388judq.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 대형언어모델(LLM)을 활용한 데이터 설명문 생성 및 선별·학습 과정 개요 </figcaption> </figure> <figure class="figure_frm origin_fig" contents-hash="ee59627f4fb37a676e3628168a4d167aeedf04d18554cf91b53bb016e9ff3df8" dmcf-pid="Bb1F135TIm" dmcf-ptype="figure"> <p class="link_figure"><img alt="대형언어모델(LLM)이 생성한 이미지 설명문과 인공지능이 계산한 영향 점수(Influence Score) 예시" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/28/Edaily/20251228105209642uctk.jpg" data-org-width="670" dmcf-mid="F5zBzb71IT" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/28/Edaily/20251228105209642uctk.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 대형언어모델(LLM)이 생성한 이미지 설명문과 인공지능이 계산한 영향 점수(Influence Score) 예시 </figcaption> </figure> <div contents-hash="6955104a5f7e3f87db44bed7f5354142eb9e78be8b7a0089bd4c1fb8f12faf57" dmcf-pid="bKt3t01ywr" dmcf-ptype="general"> 그래서 연구팀은 텍스트 영향력 점수 IFT(Influence scores For Texts)라는 지표를 설계했다. IFT는 두 축을 합쳐 계산한다. </div> <p contents-hash="2d02bbd6073c9c0497cec16e607edccd139389b216ae1a3a140e9ca8d6135c1d" dmcf-pid="K9F0FptWIw" dmcf-ptype="general">첫째는 특정 문장을 학습 데이터에서 뺐을 때 모델 예측 오차가 얼마나 변하는지로 측정하는 ‘영향력 점수’다. </p> <p contents-hash="f0d0672bdae07ecb420f557f606bfd4fb33f46c96e19c8081e27da3033d7982f" dmcf-pid="923p3UFYED" dmcf-ptype="general">둘째는 그 문장이 이미지의 시각 정보와 의미적으로 얼마나 잘 맞는지를 나타내는 CLIP 점수다. “학습에 영향을 줬는가”와 “이미지와 말이 제대로 맞물리는가”를 동시에 본 셈이다.</p> <p contents-hash="f7b7a88ceef6c311dab9835eb006d5c64ec43e7046975be4b3d1fc472d0a5093" dmcf-pid="2V0U0u3GIE" dmcf-ptype="general">예를 들어 조류 분류 모델에서 배경색 설명보다 “부리 형태”, “깃털 무늬”를 묘사한 문장이 높은 IFT를 받았다면, 모델이 배경이 아니라 부리와 깃털을 보고 새를 구분했을 가능성이 크다는 식으로 해석할 수 있다. 데이터에 달린 문장들이 일종의 ‘판단 근거 자막’ 역할을 하는 구조다.</p> <p contents-hash="073c83982cac64eef12e6ae85f2344cbf6194219d66369d481657b25c81ffeee" dmcf-pid="Vfpup70HIk" dmcf-ptype="general">연구팀은 선별된 ‘영향력 높은 설명문’이 실제 성능 개선으로 이어지는지도 별도 실험으로 확인했다. 영향력 높은 설명문을 학습에 함께 제공하고, 새로운 데이터셋에서 분류 성능을 비교하는 교차 모달 전이 실험을 진행한 결과 기존 방식보다 안정적으로 높은 성능을 보였다고 밝혔다. 제로샷(추가 학습 없이 분류) 벤치마크에서도 텍스트와 이미지 간 의미 정합도가 높아지며 성능 개선이 관찰됐다는 설명이다.</p> <p contents-hash="2c682437412518031f936ee77cdc9883fdc74aabd22c2e6ac9d02f7218f615ef" dmcf-pid="f4U7UzpXIc" dmcf-ptype="general">김태환 교수는 “AI가 스스로 학습 데이터를 설명하는 방식은 딥러닝의 복잡한 의사결정 과정을 본질적으로 드러내는 방법이 될 수 있다”며 “블랙박스 AI 시스템을 더 투명하게 이해하는 기반이 될 것”이라고 말했다.</p> <p contents-hash="836614180869c604b818429d9dbbf35af158227ba7497bcaef5cacb278f08ed1" dmcf-pid="48uzuqUZEA" dmcf-ptype="general">이번 연구는 자연어처리 분야 국제학회 EMNLP 2025에 정식 논문으로 채택됐다. 논문명은 ‘Data Descriptions from Large Language Models with Influence Estimation’이다.</p> <p contents-hash="61d2a9fe07276590f8b24916d525eecf9b078307c5b7b79c79385d37ca688574" dmcf-pid="867q7Bu5wj" dmcf-ptype="general">김현아 (chaos@edaily.co.kr) </p> </section> </div> <p class="" data-translation="true">Copyright © 이데일리. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기