로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
‘주가조작 무혐의’ 임창정, 촌스러운 발라드로 컴백한다
N
[연예뉴스]
‘나솔사계’ 미스터 박, 16기 영자 제일 아름답다더니…나이 차에 ‘고개 푹’
N
[연예뉴스]
스트레이 키즈, 어둠 밝히는 독보적 비주얼! 새 앨범 ‘合 (HOP)’ 유닛 및 단체 이미지 공개
N
[연예뉴스]
쓰리피스, ‘新 군통령’ 탄생 예고···군 장병 마음 장악한 비주얼X실력 ‘군부대 공연 성료’
N
[연예뉴스]
조세호, 신혼여행 후 ‘1박 2일’ 복귀…이준 “행복 다음은 언제나 불행”
N
커뮤니티
더보기
[자유게시판]
오늘 메뉴는 분식에 어묵탕입니다
N
[자유게시판]
주말 점심시간
N
[자유게시판]
벌써 다들 가셧나?
N
[자유게시판]
골스 그래도 꾸역승했네용
N
[자유게시판]
골스뉴올이랑 영혼의한타하네요
N
제휴문의 @spostar
제휴문의 @spostar
목록
글쓰기
[IT뉴스]'GPT-5' 공부량 8배나 느는데... 더 학습시킬 데이터가 없다
온카뱅크관리자
조회:
66
2024-04-03 04:30:16
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">"향후 4년 내 수요가 공급 초과" 전망<br>'양질의 데이터' 확보 경쟁 격화할 듯</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="2GenYFXDGP"> <figure class="figure_frm origin_fig" dmcf-pid="VyxdT5Yct6" dmcf-ptype="figure"> <p class="link_figure"><img alt="인공지능을 형상화한 이미지. 로이터 연합뉴스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202404/03/hankooki/20240403043019531rpat.jpg" data-org-width="640" dmcf-mid="KXoW8dQ0Yx" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202404/03/hankooki/20240403043019531rpat.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 인공지능을 형상화한 이미지. 로이터 연합뉴스 </figcaption> </figure> <p dmcf-pid="f7kru2qyZ8" dmcf-ptype="general">인공지능(AI) 개발 기업들이 조만간 학습 데이터 부족으로 어려움을 겪을 수 있다는 관측이 제기됐다. AI 모델은 통상 학습하는 데이터가 많을수록 성능이 향상되는데, 현재 인터넷에서 사용 가능한 데이터는 한정돼 있기 때문이다.</p> <p dmcf-pid="4zEm7VBWX4" dmcf-ptype="general">월스트리트저널(WSJ)은 1일(현지시간) "강력한 AI를 개발하기 위해 경쟁하는 기업들이 새로운 문제에 예상보다 빠르게 직면하고 있다"며 "인터넷 공간이 그들의 계획에 비해 너무 작을 수 있다는 것"이라고 전했다.</p> <p dmcf-pid="8qDszfbY1f" dmcf-ptype="general">보도에 따르면 AI 동향을 추적하는 에포크연구소는 오픈AI가 개발 중인 차세대 거대언어모델(LLM) GPT-5가 60조 개에서 최대 100조 개의 토큰(문장의 최소 단위)을 학습할 것으로 전망했다. 반면 지난해 출시된 GPT-4는 최대 12조 개를 학습한 것으로 추산했다. GPT-5를 훈련시키는 데 GPT-4가 학습한 양의 8배가 넘는 데이터가 필요할 수 있다는 얘기다. 하지만 오픈AI가 GPT-5에 현재 사용 가능한 고품질의 글과 이미지 데이터를 총동원해 학습시켜도 여전히 10조~20조 개가 모자랄 것으로 예측됐다.</p> <hr class="line_divider" dmcf-pid="65naZUtsZV" dmcf-ptype="line"> <h3 dmcf-pid="P1LN5uFO12" dmcf-ptype="h3">챗GPT 문턱 낮춘 오픈AI, 데이터 확보 노림수?</h3> <p dmcf-pid="QVIS2x41Z9" dmcf-ptype="general">이 연구소는 고품질 데이터에 대한 수요가 올해 중반 공급을 초과할 확률을 50% 정도로 보고 있다. 늦어도 2028년에는 90%의 가능성으로 수요가 공급을 넘어설 것으로 점치고 있다. 이미 공급이 수요를 따라가지 못하고 있는 AI 칩처럼 데이터가 턱없이 부족해지는 상황이 4년 안에 도래할 가능성이 크다는 뜻이다. 이렇게 되면 "AI 개발 속도가 둔화할 수 있다"고 WSJ는 분석했다. </p> <p dmcf-pid="xfCvVM8tYK" dmcf-ptype="general">이에 따라 양질의 데이터를 더 빨리, 더 많이 확보하려는 개발사 간 경쟁이 치열해지고 있다. 오픈AI는 GPT-5 학습 데이터 확보를 위해 최근 유튜브 동영상 녹취본 활용이 가능한지를 논의했다고 WSJ는 전했다. 경쟁사인 구글의 플랫폼까지 잠재적 정보 공급처로 검토할 만큼 양질의 데이터 확보에 애를 먹고 있다는 것이다.</p> <p dmcf-pid="yCfPIWlo1b" dmcf-ptype="general">업계에서는 오픈AI가 이날부터 계정 가입이나 로그인 없이도 챗GPT를 이용할 수 있게 한 것 역시 데이터 확보를 위한 것으로 보고 있다. 이용 절차가 간편해지면 이용자가 증가할 가능성이 크고, 이용자층이 확대되면 자연히 데이터 수집량도 늘기 때문이다.</p> <figure class="figure_frm origin_fig" dmcf-pid="Wn53iAo95B" dmcf-ptype="figure"> <p class="link_figure"><img alt="지난해 11월 6일 미국 샌프란시스코에서 열린 오픈AI의 첫 개발자 콘퍼런스에서 샘 올트먼(왼쪽) 오픈AI 최고경영자(CEO)가 무대에 깜짝 등장한 사티아 나델라 마이크로소프트 CEO와 악수하고 있다. 샌프란시스코=이서희 특파원" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202404/03/hankooki/20240403043023233zuvf.jpg" data-org-width="640" dmcf-mid="9Q07awA8ZQ" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202404/03/hankooki/20240403043023233zuvf.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 지난해 11월 6일 미국 샌프란시스코에서 열린 오픈AI의 첫 개발자 콘퍼런스에서 샘 올트먼(왼쪽) 오픈AI 최고경영자(CEO)가 무대에 깜짝 등장한 사티아 나델라 마이크로소프트 CEO와 악수하고 있다. 샌프란시스코=이서희 특파원 </figcaption> </figure> <hr class="line_divider" dmcf-pid="GotpLkaVGz" dmcf-ptype="line"> <h3 dmcf-pid="HyxdT5Yc17" dmcf-ptype="h3">'데이터 값' 산출 시스템도 개발 중</h3> <p dmcf-pid="XWMJy1GkYu" dmcf-ptype="general">AI 학습용 데이터가 빠르게 고갈되는 것은 언론사 등이 저작권 보호를 명분으로 데이터 사용을 막고 있기 때문이기도 하다. AI 개발사들은 이 문제를 해결하기 위한 방안도 연구하고 있는 것으로 알려진다. 구체적으로 오픈AI와 구글은 특정 콘텐츠가 AI 모델의 성능 향상에 얼마나 기여했는지를 평가하고 금액으로 계산해 내는 시스템을 개발 중이라고 알려졌다. 이른바 '데이터 값' 산출 근거를 마련해 이를 바탕으로 언론사들과 데이터 거래를 하겠다는 계획인 셈이다. </p> <p dmcf-pid="ZmKfrSOJtU" dmcf-ptype="general">데이터를 스스로 충당하는 방안도 찾고 있다. AI 모델이 생성해낸 데이터를 다시 AI 학습에 사용하겠다는 것이다. 이 경우 AI 개발사 입장에서는 데이터 이용료를 따로 지불할 필요가 없어지지만, AI가 잘못 만들어낸 정보가 확대 재생산될 위험성이 크다는 한계가 있다.</p> <p dmcf-pid="1O28sTCnX0" dmcf-ptype="general">실리콘밸리= 이서희 특파원 shlee@hankookilbo.com</p> </section> </div> <p class="" data-translation="true">Copyright © 한국일보. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
1
올나잇스머프
1900
2
논현동똥식이
1800
3
비가오는날
1800
4
그랑프리옥황상제
1700
업체홍보/구인
더보기
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
[구인]
여왕벌에서 유능한 총판 파트너 모집합니다
[구인]
자택 알바 구합니다.(투잡/장기 가능)
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
N
N
N
N
N
N
채팅하기