로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[IT뉴스]
[CES 2026] LG이노텍 문혁수 "고수익·고부가 ‘솔루션’ 전략… 위닝테크 기술 확보"
N
[연예뉴스]
[CES 2026] LG이노텍 문혁수 "고수익·고부가 ‘솔루션’ 전략… 위닝테크 기술 확보"
N
[연예뉴스]
‘체인지 스트릿’ 모든 무대가 레전드! 이승기부터 투모로우바이투게더 태현까지 1차 한일 아티스트 마지막 버스킹
N
[스포츠뉴스]
'강이슬 트리플더블' KB, 삼성생명 꺾고 공동 2위로
N
[연예뉴스]
에이핑크 윤보미, 라도와 5월 결혼 앞두고 심경…"실감 안 나"
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스][사이테크+] "LLM 인공지능, 믿음-지식·사실-허구 제대로 구분 못 해"
온카뱅크관리자
조회:
38
2026-01-05 08:17:33
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">美 연구팀 "법률·의학·과학 등 AI 적용할 때 결과 활용에 주의해야"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="0p9vQgfzGe"> <p contents-hash="32d0857fae22337959c76d401e27d83886b979998f557a6e954e1bbfb9e8a6ef" dmcf-pid="poDfhZmjtR" dmcf-ptype="general">(서울=연합뉴스) 이주영 기자 = 챗GPT 같은 대규모 언어모델(LLM) 인공지능(AI)은 사람들의 믿음(belief)과 지식(knowledge), 사실(fact)과 허구(fiction)를 신뢰성 있게 구분하지 못한다는 연구 결과가 나왔다.</p> <figure class="figure_frm origin_fig" contents-hash="bf9e688ddd4487b7b263d2deabab061aa64210bb70b5c55ce2ea379b69b2f76c" dmcf-pid="Ugw4l5sAXM" dmcf-ptype="figure"> <p class="link_figure"><img alt="인공지능(AI) [로이터 연합뉴스 자료사진. 재판매 및 DB 금지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/05/yonhap/20260105080957973kxvv.jpg" data-org-width="500" dmcf-mid="FqM1ord8tJ" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/05/yonhap/20260105080957973kxvv.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 인공지능(AI) [로이터 연합뉴스 자료사진. 재판매 및 DB 금지] </figcaption> </figure> <p contents-hash="7215a36457d507c380a80af7ef0db548fe440eb745be3b999592fd9495e75cc1" dmcf-pid="uar8S1Oc1x" dmcf-ptype="general">미국 스탠퍼드대 제임스 저우 교수팀은 5일 과학 저널 네이처 머신 인텔리전스(Nature Machine Intelligence)에서 챗GPT와 딥시크 등 LLM 24종에 대해 개인의 지식과 믿음에 대해 어떻게 반응하는지 분석, 이런 결과를 얻었다고 밝혔다.</p> <p contents-hash="2798c3b246a20a302adccf38ea1b063d49ef51c6fd0bb822917895e042215341" dmcf-pid="7Nm6vtIk5Q" dmcf-ptype="general">연구팀은 이 연구는 LLM을 법률, 의학, 과학 등 믿음이나 의견이 사실과 대비되는 분야에 적용할 경우, AI가 내놓는 결과를 의사 결정에 활용할 때 주의할 필요가 있다는 것을 보여준다고 말했다.</p> <p contents-hash="f43406a9d47b678310d3ce40e2caa20d9be120d8eea67e85a3982d1f2c9faa4c" dmcf-pid="zjsPTFCE5P" dmcf-ptype="general">챗GPT와 딥시크(DeepSeek), 제미나이(Gemini), 라마(Llama), 클로드(Claude) 등 LLM 기반 AI가 법률, 의학, 저널리즘, 과학 등 고위험 분야에 빠르게 확산하면서 믿음과 지식, 사실과 허구를 구분하는 능력이 더욱 중요해지고 있다.</p> <p contents-hash="e07ad57d7e236899847e6a3bd735fb20e94b9a849b281865f562318f8e94086e" dmcf-pid="qAOQy3hD56" dmcf-ptype="general">연구팀은 이런 분야에서 AI가 지식과 믿음, 사실과 허구를 제대로 구분하지 못하면, 질병 등에 대한 잘못된 진단을 초래하고, 법률적 판단을 왜곡하며, 허위 정보를 증폭시킬 위험이 있다고 지적했다.</p> <p contents-hash="10aa457f8bffe637a6756cc83d94e7397881e91974b1e32ad9f0151dba991fd0" dmcf-pid="BcIxW0lwH8" dmcf-ptype="general">이들은 이 연구에서 챗GPT-4o(GPT-4o) 출시 기준으로 딥시크, 라마, 제미나이, 클로드 등 LLM 24종을 신형 모델과 구형 모델로 나누고, 질문 1만3천개를 통해 사실과 허구, 사실 기반 믿음과 허구 기반 믿음 등에 어떻게 반응하는지 분석했다.</p> <p contents-hash="88474357fb2889e469a45e7559e6875f1b9d0484320366fd0b99d9525746d4f2" dmcf-pid="bkCMYpSrG4" dmcf-ptype="general">질문에는 '호주 수도는 캔버라(시드니)다', '나는 호주 수도가 캔버라(시드니)라고 믿는다', '메리는 호주 수도가 캔버라(시드니)라고 믿는다'처럼 사실과 허구가 포함되고, 일인칭과 삼인칭 믿음을 나타내는 문구가 사용됐다.</p> <figure class="figure_frm origin_fig" contents-hash="c2cae5e557a44c13f01742a56527abb0d6c4a5b3b3376344fbec83e2ec258f70" dmcf-pid="KEhRGUvmHf" dmcf-ptype="figure"> <p class="link_figure"><img alt="24개 LLM의 허구 기반 1인칭 믿음 인식 확률 모든 LLM 인공지능(AI)은 1인칭 믿음(나는 ~라고 믿는다=I believe that~)을 제시할 경우, 믿는 내용이 사실일 경우보다 허구일 경우 그것이 지식이 아니라 믿음이라는 것을 인식하는 능력이 크게 떨어지는 것으로 나타났다. GPT-4o의 정확도는 98.2%(사실)에서 64.4%(허구)로 떨어졌고, DeepSeek R1은 90% 이상(사실)에서 14.4%(허구)로 급감했다. [Nature Machine Intelligence, James Zou et al. 제공. 재판매 및 DB 금지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/05/yonhap/20260105080958121xkpf.jpg" data-org-width="872" dmcf-mid="34Bh8n9UHd" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/05/yonhap/20260105080958121xkpf.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 24개 LLM의 허구 기반 1인칭 믿음 인식 확률 모든 LLM 인공지능(AI)은 1인칭 믿음(나는 ~라고 믿는다=I believe that~)을 제시할 경우, 믿는 내용이 사실일 경우보다 허구일 경우 그것이 지식이 아니라 믿음이라는 것을 인식하는 능력이 크게 떨어지는 것으로 나타났다. GPT-4o의 정확도는 98.2%(사실)에서 64.4%(허구)로 떨어졌고, DeepSeek R1은 90% 이상(사실)에서 14.4%(허구)로 급감했다. [Nature Machine Intelligence, James Zou et al. 제공. 재판매 및 DB 금지] </figcaption> </figure> <p contents-hash="b7571b5aa063cc76f6bdf0ea2b70e8573424bff91bd76748b28c88655a801989" dmcf-pid="9rvJZzWIGV" dmcf-ptype="general">그 결과 사실과 허구가 명확한 데이터를 검증할 때, GPT-4o 이전에 출시된 구형 모델은 사실 판단 정확도가 71.5~84.8%였으나 GPT-4o와 이후 출시된 신형 모델은 정확도가 91.1~91.5%로 높아진 것으로 나타났다.</p> <p contents-hash="7b5b3cfc565b4b4305dfeaa33c1b8bf9bba6ebf8f30d599000e2418e8bf54688" dmcf-pid="2mTi5qYC52" dmcf-ptype="general">그러나 1인칭 믿음(나는~라고 믿는다=I believe that~)을 제시할 때는, 믿는 내용이 사실인 경우보다 허구인 경우 그것이 믿음이라는 것을 인식하는 능력이 모든 모델에서 크게 떨어지는 것으로 나타났다. </p> <p contents-hash="0a9b533f3417548c9fb051033d0ff645793da37e9bde86337910ce556ed55b91" dmcf-pid="Vsyn1BGhH9" dmcf-ptype="general">신형 모델은 사실 기반 1인칭 믿음보다 허구 기반 1인칭 믿음을 인식하는 확률이 평균 34.3% 낮았고, 구형 모델은 그 격차가 평균 38.6%나 됐다. GPT-4o의 정확도는 98.2%에서 64.4%로, 딥시크 R1은 90% 이상에서 14.4%로 떨어졌다.</p> <p contents-hash="c68eb51150dcd0f88de51f1f7936d11a48f31a077bd14adb203f6633d5578158" dmcf-pid="fOWLtbHltK" dmcf-ptype="general">그러나 3인칭 믿음(메리는 ~라고 믿는다)에 대한 인식 정확도는 1인칭 믿음보다 훨씬 높았다. 허구 기반 3인칭 믿음에 대한 인식 정확도는 신형 모델이 95%, 구형 모델은 79%였다. </p> <p contents-hash="56c3dc03deac9482a4271b2611fb2160522f024f1694eeeb0b26e71bc88a0c4d" dmcf-pid="4IYoFKXStb" dmcf-ptype="general">연구팀은 이 연구에서 LLM은 사용자가 믿는 내용이 허구인 경우 그것을 '믿음'이라고 인정하기보다, 틀린 '지식'으로 보고 사실적으로 사용자를 교정하려는 방식으로 대응하는 경향을 보였다고 지적했다.</p> <p contents-hash="1addc68b6bd9470360c8e073b3af8f5a3059dbc35c8eb385fdf01d57a1d7a802" dmcf-pid="8CGg39ZvZB" dmcf-ptype="general">이어 LLM이 사실과 믿음의 미묘한 차이, 그리고 그것이 사실인지 거짓인지 성공적으로 구분할 수 있어야 사용자의 질의에 효과적으로 대응하고 허위 정보 확산을 막을 수 있을 것이라고 강조했다.</p> <p contents-hash="029bd03801cbe5185e0f3094be67346762e07ceb0c0d35b00319f5010b54b51b" dmcf-pid="6hHa025TZq" dmcf-ptype="general">◆ 출처 : Nature Machine Intelligence, James Zou et al., 'Language models cannot reliably distinguish belief from knowledge and fact', https://www.nature.com/articles/s42256-025-01113-8</p> <p contents-hash="5709e11bac1a9f4324a447ade09747e34e8ec114d04e9af137d40ee6176bad6d" dmcf-pid="PlXNpV1yZz" dmcf-ptype="general">scitech@yna.co.kr</p> <p contents-hash="d8adbd697d87a03d92eb8f61493e42e0cab6fd1b1e1ce3c82b8ca5b767489085" dmcf-pid="xv5Au4FYHu" dmcf-ptype="general">▶제보는 카톡 okjebo</p> </section> </div> <p class="" data-translation="true">Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기