로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
'과징금 취소' 1심 승소 카카오엔터 "정확한 판결"(종합)
N
[실시간뉴스]
교묘히 공시 피하고 모두투어 지분 8% 쓸어담은 야놀자… 경영권 분쟁 가능성 고조
N
[IT뉴스]
카카오게임즈, '오딘·아키에이지' 핵심 IP 확장... 하반기 대형 신작으로 반등 노린다
N
[IT뉴스]
우는 아이 목소리에 ‘철렁’…인터폴 ‘AI 피싱’ 경고
N
[IT뉴스]
AI시대 핵심 인프라 강조하지만…'데이터센터 진흥' 법안 통과 전무
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스]오픈AI 거대언어모델 'o3', 과학 분야 답변 평가에서 1위
온카뱅크관리자
조회:
69
2025-07-12 08:17:29
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="4XB6ariBlJ"> <figure class="figure_frm origin_fig" contents-hash="e3823a33fafff59b956f8a7a5acff8252f8aed4befb6805b57a3b235e50e2a22" dmcf-pid="8ZbPNmnbWd" dmcf-ptype="figure"> <p class="link_figure"><img alt="오픈AI가 개발한 'o3'가 과학 분야 질문 평가 모델에서 1위에 올랐다. 게티이미지뱅크 제공." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/12/dongascience/20250712081610399ikef.jpg" data-org-width="680" dmcf-mid="uQRGz40Cvk" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/12/dongascience/20250712081610399ikef.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 오픈AI가 개발한 'o3'가 과학 분야 질문 평가 모델에서 1위에 올랐다. 게티이미지뱅크 제공. </figcaption> </figure> <p contents-hash="9448365c1b927043005f4beadf31db361305d42acd60f62e9de04cace928e254" dmcf-pid="65KQjsLKhe" dmcf-ptype="general"> 오픈AI가 개발한 거대 언어모델(LLM) 'o3'가 과학분야 질문 답변 평가 모델에서 1위에 올랐다고 네이처가 10일(현지 시간) 보도했다. 마이크로소프트 공동창업자 폴 앨런이 설립한 비영리 인공지능 연구기관 '앨런 인공지능연구소(Allen Institute for Artificial Intelligence)'가 지난주 공개한 벤치마킹 플랫폼 '사이아레나(SciArena)'를 통해 도출된 결과다.</p> <p contents-hash="34cca733997da8384cbe81d423010ea156a4371ace4447e616ce5404682e0c02" dmcf-pid="P19xAOo9TR" dmcf-ptype="general">사이아레나는 AI 모델의 특정 작업 성능을 평가하기 위해 개발된 최신 플랫폼이다. 이번 연구 결과는 23개의 최신 LLM이 △자연과학 △공학 △보건의료 △인문〮사회과학 등 4개 영역 분야 질문에 어떻게 답변하는지 평가했다.</p> <p contents-hash="1b6a1a03ca418e069ac1d98a51472fcba959c38099481002d2caf0fc7903c75f" dmcf-pid="Qt2McIg2vM" dmcf-ptype="general">연구자 102명이 결과를 보고 각 질문에 대해 무작위로 두 모델의 답변을 듣고 어느 쪽이 더 나은지, 비슷했는지 아니면 둘 다 부족한지 등을 투표했다. 각 답변에는 앨런 인공지능연구소가 개발한 논문 검색 도구 '시맨틱 스칼라(Semantic Scholar)'에서 실제 학술 자료나 논문 등이 인용근거로 첨부돼 답변의 신뢰성과 근거를 높였다.</p> <p contents-hash="c5687a4dfc643d16616e1450000a1d4b3e6e60cc213d3f1b935e03358cac4290" dmcf-pid="xFVRkCaVyx" dmcf-ptype="general">오픈AI는 4개 부문 모두에서 1위를 차지했다. 중국 딥시크의 R1은 자연과학에서 2위, 공학에서 4위를 각각 차지했다. 구글의 제미나이(Gemini-2.5-Pro)는 자연과학 3위, 공학 5위, 보건의료 5위에 이름을 올렸다. 아르만 코한 앨런 인공지능연구소 연구원은 "인용문헌에 대한 상세한 설명과 기술적으로 정교한 답변 때문에 연구원들에게 좋은 평가를 받은 것"이라고 설명했다.</p> <p contents-hash="b5d1367d06b5bc9fda98f9c786081eb39548bf57e78753fc7977ffaf41ff9bf0" dmcf-pid="ygIY7f3IlQ" dmcf-ptype="general">대부분의 모델이 비공개이기 때문에 성능 차이의 구체적인 원인을 설명하기는 어렵다고 했다. 하지만 각 AI모델에 어떤 데이터를 얼마나 어떻게 학습했는지, 또 어떤 목적에 맞춰 최적화됐는지가 성능에 영향을 미칠 수 있었을 것이라는 의견을 덧붙였다.</p> <p contents-hash="ba18fc5fd598125c278a5f20e05fda70f068d176ebaa86fd491b6de21f2c6298" dmcf-pid="WaCGz40CWP" dmcf-ptype="general">사이아레나는 누구나 무료로 접속해 연구 질문을 입력하고 AI를 통해 도출된 답변을 비교해볼 수 있다. 모든 사용자가 답변을 평가할 수 있지만 공식 기록에는 인증된 사용자의 투표만 반영된다. 플랫폼은 사용자 조작 등 문제를 방지하기 위해 신뢰성 높은 운영 방식을 택했다고 강조했다. </p> <p contents-hash="e825c67909b1967774482d62bec5db20b3fabb357d45ba162b21f5e10e3ca515" dmcf-pid="YNhHq8phW6" dmcf-ptype="general">조너선 쿠머펠드 시드니대 AI 연구원은 "LLM에서 신뢰할 만한 과학적 답을 얻을 수 있다면, 연구자들이 최신 문헌을 따라가는데도 유용할 것"이라고 말했다. 한계와 주의점도 있다. 과학자들은 LLM이 인용 논문과 모순되는 문장을 만들거나 용어를 오해하거나, 정확한 답을 하지 못할 수도 있다는 점을 잊어서는 안 된다고 경고했다. <br> </p> <p contents-hash="11b713cf7503e02d534e14a4d05e66a379cb33a87f180b8634704f9903ff5ca1" dmcf-pid="GjlXB6Uly8" dmcf-ptype="general">[정지영 기자 jjy2011@donga.com]</p> </section> </div> <p class="" data-translation="true">Copyright © 동아사이언스. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기