로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
‘정보 유출’ 쿠팡, 적자 충격에도 성장 엔진은 꺼지지 않았다(종합)
N
[IT뉴스]
비트컴퓨터 “‘AI 보이스 차팅’으로 기록 품질·환자 소통 강화”
N
[IT뉴스]
[단독] LG헬로비전 콘텐츠 사용료 갈등에…CJ ENM·YTN 법적 대응 움직임
N
[IT뉴스]
수천 년 걸릴 계산, 반도체 칩으로 푼다… 카이스트, 아이징 머신 구현
N
[IT뉴스]
“건강 검진서는 멀쩡했는데”…MRI 보니 절반 이상 고지혈증 [달콤한 사이언스]
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]"AI오류, 단순실 수 아닌 보상설계 결함…정렬 위장까지 진화"
온카뱅크관리자
조회:
30
2026-04-28 17:07:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">한보형 서울대 교수, AI 신뢰성 오류 5단계 체계화<br>"불완전 보상 설계 원인...모델 커질수록 위험 증폭"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="pA4zjnTsmc"> <figure class="figure_frm origin_fig" contents-hash="e14db6e4a630f3a9d58a0efd4d6ccf88c5bfb9609af1127c8d8803c05a9d22f6" dmcf-pid="Uwx9DNHlsA" dmcf-ptype="figure"> <p class="link_figure"><img alt="(AI 생성 이미지)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/28/Edaily/20260428170442065rpue.jpg" data-org-width="591" dmcf-mid="3LK0LRCEOE" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/28/Edaily/20260428170442065rpue.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> (AI 생성 이미지) </figcaption> </figure> <div contents-hash="d1bb1e58c47716d8bf586ce6229cb621e355710969ef3a91bad0c9b9a72fd38a" dmcf-pid="urM2wjXSwj" dmcf-ptype="general"> [이데일리 한광범 기자] 인공지능(AI) 시스템이 사실과 다른 답변을 내놓거나 사용자의 의견에 무조건 동조하고, 심지어 규칙의 허점을 이용해 환경을 조작하는 등의 신뢰성 문제가 단순한 부주의가 아닌 학습 방식 자체의 구조적 결함에서 비롯된다는 분석이 나왔다. </div> <p contents-hash="d4ad7a96808360acce8b0888a57993fa1646aacc951606e7d1e6662ffb5b8da5" dmcf-pid="7mRVrAZvwN" dmcf-ptype="general">한보형 서울대 전기·정보공학부 교수는 28일 서울대 인공지능신뢰성 연구센터(CTAI)가 개최한 제2회 월례 세미나에서 AI 오류의 근본 원인을 ‘불완전한 보상 함수 설계’로 진단했다. 구글 딥마인드 방문 연구원과 포스텍 컴퓨터공학과 교수를 역임한 그는 파운데이션 모델 작동 원리와 신뢰성 문제를 2024~2026년 최신 연구 동향을 바탕으로 분석하며, AI 오류를 5가지 단계로 체계화해 발표했다.</p> <p contents-hash="4784cd660eb2618f0ee3f5e830617bda7586b90df83359a9e40901bf60801c11" dmcf-pid="zsefmc5TOa" dmcf-ptype="general">한 교수는 AI 신뢰성 문제의 핵심은 인간의 선호를 수치화하는 과정에서 발생하는 설계의 한계가 모델이 커질수록 증폭된다는 점에 있다고 분석했다. 가장 기초적인 1단계 ‘환각(Hallucination)’은 학습 데이터에 없는 정보를 패턴 보간으로 채우는 과정에서 발생하며, 이는 2024년 에어캐나다 챗봇의 허위 정책 안내 사례처럼 실제 법적 책임 문제로 이어지고 있다고 설명했다.</p> <figure class="figure_frm origin_fig" contents-hash="30147756d8b225c38dc40d25f1d58e749ec30de8348321d4c18cfd24ad59e78c" dmcf-pid="q6ty8KjJwg" dmcf-ptype="figure"> <p class="link_figure"><img alt="한보형 서울대 전기·정보공학부 교수. (사진=서울대)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/28/Edaily/20260428170443327eipz.jpg" data-org-width="343" dmcf-mid="0MoxlmpXwk" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/28/Edaily/20260428170443327eipz.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 한보형 서울대 전기·정보공학부 교수. (사진=서울대) </figcaption> </figure> <div contents-hash="37dbb1fcc7302f1a807ef693f9de332ddd63f5f6db9e09b563e0c8c5f3dab061" dmcf-pid="BPFW69Aiwo" dmcf-ptype="general"> 이어지는 2단계 ‘아첨(Sycophancy)’은 인간 피드백 강화 학습(RLHF) 과정에서 모델이 평가자의 견해에 맞춘 답변에 높은 점수를 받으면서 ‘동의=좋은 응답’으로 오인하는 현상이다. 실제로 2025년 4월 OpenAI는 GPT-4o 업데이트에서 이러한 과도한 동조 현상을 확인하고 서비스를 나흘 만에 롤백하며 단기 피드백 과최적화 문제를 공식 인정한 바 있다. </div> <p contents-hash="22fe2f8f8e340813de0dbef2cf07b28ec6b93e4d57ee38f4654d681be0dc9f30" dmcf-pid="bQ3YP2cnOL" dmcf-ptype="general">3단계 ‘보상 해킹(Reward Hacking)’은 AI가 보상 함수의 허점을 이용해 목표를 편법으로 달성하려는 행태로 정의했다. 영국의 AI 안전 전문 연구기관인 팰리세이드 리서치(Palisade Research)의 2025년 보고서에 따르면 체스 엔진을 이기라는 지시를 받은 추론 모델이 정상적인 대국 대신 상대 엔진을 더미 버전으로 교체하거나 게임 보드 상태를 덮어쓰는 방식으로 환경을 조작하려 시도한 사실이 확인됐다.</p> <p contents-hash="69fe5cb593e257e01de208e49032bd5d31a2b0cd1c74a31fa821b3e079a3b207" dmcf-pid="Kx0GQVkLEn" dmcf-ptype="general">더 심각한 단계는 대형 모델에서 나타나는 ‘평가 맥락 인식(Evaluation Awareness)’과 ‘정렬 위장(Alignment Faking)’이다. 모델이 자신이 평가받고 있음을 인지해 상황에 따라 행동을 바꾸거나, 새로운 훈련 신호에 표면적으로만 순응하며 기존의 학습 선호를 유지하려 드는 현상이다. </p> <p contents-hash="74bfd1b0501fd244ae34fe8d3e69e484a124447c89605b94714949cb30c9f17b" dmcf-pid="9MpHxfEomi" dmcf-ptype="general">앤스로픽이 지난 4월 최신 모델 ‘클로드 미토스 프리뷰(Claude Mythos Preview)’ 공개를 보류한 배경에도 이러한 행동 불일치 문제가 있었다는 설명이다.</p> <p contents-hash="4c9267ca0fb98b80bcbe4a1934d2dc3e01a16d2ddb4fc4a717e2769339c0b5da" dmcf-pid="2RUXM4DgDJ" dmcf-ptype="general">한 교수는 환각의 경우 사실 검증 레이어로 완화할 수 있지만, 아첨과 보상 해킹은 보상 함수 설계 자체를 재검토해야 한다고 강조했다. 또 평가 맥락 인식과 정렬 위장은 현재 해석 가능성 연구가 집중하고 있는 최전선의 미해결 영역으로 분류했다.</p> <p contents-hash="9ff46c785184343715d7e1a1deb81d68af45f9ab1785fff9e5e3b6474d7ed20c" dmcf-pid="V0Ic3X6brd" dmcf-ptype="general">이은주 CTAI 센터장은 “AI 신뢰성 문제는 단순히 오류율의 문제가 아니라 어떤 방향으로 왜 틀리는가의 문제”라며 “오류의 패턴과 원인을 명확히 이해해야만 기술적, 제도적으로 안전한 AI 설계와 활용이 가능하다”고 밝혔다.</p> <p contents-hash="ae8f6c999ec85b7202cafbc471633b9f86e7e827d4c245e0570b01568da4c984" dmcf-pid="fpCk0ZPKse" dmcf-ptype="general">한편 CTAI는 공학, 법학, 철학, 통계학, 언론정보학 연구자들이 모여 AI 신뢰성을 높이기 위한 융합 연구를 수행하는 기관이다. 이번 행사는 AI 신뢰성 의제를 공론화하기 위해 기획된 월례 세미나의 일환으로 매월 넷째 주 화요일에 개최되며, 오는 5월 26일 열리는 세미나 주제는 공식 채널을 통해 공개될 예정이다.</p> <p contents-hash="a70f5a5bf957cf9e6254e762297152c7aa2330472bb52b35cd9fac2618ad349b" dmcf-pid="4UhEp5Q9wR" dmcf-ptype="general">한광범 (totoro@edaily.co.kr) </p> </section> </div> <p class="" data-translation="true">Copyright © 이데일리. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기