로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
'생존왕' 박태환, 머드 크랩 라면 맛에 감탄 "금메달도 필요없어"
N
[연예뉴스]
'49세' 명세빈, 이정도면 곧 결혼…"17세 연하남이 대시해" [솔로라서]
N
[연예뉴스]
김혜현VS최호종, “도파민 폭발” 계급 전쟁 지각 변동 (스테파)
N
[연예뉴스]
잔나비, 학폭 논란 前멤버와 협업 들키자 사과 "잘못된 판단"
N
[연예뉴스]
잔나비, ‘학폭 의혹’ 전 멤버 유영현 스태프로 함께 일하다 발각
N
커뮤니티
더보기
[자유게시판]
6시를 알려드립니다
N
[자유게시판]
퇴근
N
[자유게시판]
퇴근들 하셨습니까
N
[자유게시판]
10분이나마 먼저퇴군뛰
N
[자유게시판]
집으로 도망갈 준비 ㄷㄷ
N
제휴문의 @spostar
제휴문의 @spostar
목록
글쓰기
[IT뉴스]"법 어겨도 모르쇠"…불법 판 치는 빅테크, AI 학습 데이터 무단 사용
온카뱅크관리자
조회:
78
2024-04-08 09:14:59
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">오픈AI, 위법 알고도 GPT-4 훈련 위해 유튜브 영상 활용…메타·구글 등도 무단 수집</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="2rgPB2ph0k"> <p dmcf-pid="V2pWshkPUc" dmcf-ptype="general">(지디넷코리아=장유미 기자)오픈AI가 자사 생성형 인공지능(AI) 모델인 'GPT-4'를 훈련하기 위해 100만 시간 이상의 유튜브 영상을 무단 활용했다는 주장이 나왔다. 현재 인터넷상에 존재하는 데이터만으로는 2년 내 AI 모델 성능을 높이는 데 한계를 맞을 것이란 전망 속에 글로벌 빅테크들이 저작권 규정을 무시한 채 AI 학습용 데이터 확보에 사활을 거는 모습이다.</p> <p dmcf-pid="fFywoje73A" dmcf-ptype="general">8일 뉴욕타임스에 따르면 오픈AI는 지난 2021년부터 AI 훈련에 쓰일 양질의 텍스트 데이터 부족에 직면했다. 또 이를 타개하기 위해 영상에서 자동으로 스크립트를 추출하는 '위스퍼(Whisper)'라는 소프트웨어를 개발한 것으로 알려졌다.</p> <p dmcf-pid="4YuGISDxFj" dmcf-ptype="general">오픈AI는 위스퍼를 사용해 유튜브 영상에서 말소리를 텍스트로 받아 적고 이를 'GPT-4'의 AI 훈련에 사용했다. </p> <figure class="figure_frm origin_fig" dmcf-pid="8qxBtpGk7N" dmcf-ptype="figure"> <p class="link_figure"><img alt="샘 알트먼 오픈AI 최고 경영자(CEO) (사진=씨넷)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202404/08/ZDNetKorea/20240408091500398aitk.jpg" data-org-width="640" dmcf-mid="KygPB2phpD" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202404/08/ZDNetKorea/20240408091500398aitk.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 샘 알트먼 오픈AI 최고 경영자(CEO) (사진=씨넷) </figcaption> </figure> <p dmcf-pid="69d2pz5r3a" dmcf-ptype="general">앞서 오픈AI는 전작인 GPT-3 학습을 위해 주로 깃허브, 위키피디아와 같은 온라인 무료 오픈소스 플랫폼에 올라온 데이터 토큰(언어·이미지·코드 등의 결과물)을 약 3천억여개 수집해 사용했다. 그러나 GPT-4의 기능을 향상하기 위해 더 큰 규모의 학습 데이터가 필요해지자 유튜브 영상, 팟캐스트 콘텐츠 등을 활용한 것으로 전해졌다.</p> <p dmcf-pid="Pfn47bFOUg" dmcf-ptype="general">오픈AI는 텍스트 기반 생성형 AI '챗GPT' 출시 이후 계속해서 저작권 침해 논란에 휩싸였다. 앞서 미국 뉴욕타임스는 자사 콘텐츠를 무단으로 기계 학습에 활용했다며 오픈AI를 상대로 지난해 저작권 침해 소송을 냈다. 논란이 이어지자 오픈AI는 CNN·타임지 등에 뉴스 사용료를 내고 콘텐츠를 기계 학습에 이용하는 내용의 계약을 맺기도 했다.</p> <p dmcf-pid="Qfn47bFOUo" dmcf-ptype="general">파블로 비라로보스 에포크 연구원은 최근 월스트리트저널을 통해 "컴퓨터 과학 원리 중 '친칠라 스케일링 법칙'에 따라 'GPT-5'와 같은 AI 시스템은 현재의 성장 궤적을 따른다면 60조~100조 개의 데이터 토큰이 필요할 것"이라며 "이는 현재 사용 가능한 모든 고품질 텍스트 데이터를 10조~20조 개 이상 넘어서는 것"이라고 지적했다.</p> <p dmcf-pid="xjhAdLP30L" dmcf-ptype="general">친칠라 스케일링 법칙이란 700억 개 매개변수의 친칠라 모델과 2천800억 개 매개변수의 고퍼 모델의 성능을 비교한 2022년의 실험 결과에서 비롯했다. 특정 매개변수 모델이 최적의 성능을 발휘하기 위해 필요한 학습 데이터양을 추정해 낸 것인데, 여기서 유추된 법칙에 따르면 5천300억 개 매개변수를 가진 모델의 경우 11조 개 토큰 상당의 학습 데이터가 필요하다. 이에 따라 매개변수가 2조 개에 달할 것으로 보이는 GPT-5는 60조 개 이상의 토큰 학습이 필요하다는 결론이 나온다.</p> <p dmcf-pid="yDywoje77n" dmcf-ptype="general">에이리 모르코스 데이톨로지AI 창립자 겸 CEO는 "데이터 부족은 아직 미개척된 연구 분야"라며 "스파게티가 익었는지 벽에 던져 확인하는 것처럼 (데이터 부족은) 실제로 닥치지 않으면 알 수 없는 문제"라고 밝혔다.</p> <p dmcf-pid="WzQq10Yczi" dmcf-ptype="general">이에 오픈AI의 직원들은 AI를 학습시키는 것은 정당한 이용 목적에 해당할 수 있다고 믿으며 위법 가능성을 인지하고 있었음에도 유튜브 콘텐츠를 무단 활용한 것으로 알려졌다. 하지만 현재 유튜브는 플랫폼에 올라온 영상을 재활용하는 것을 금지하고 있다.</p> <p dmcf-pid="YdEJ4QbYUJ" dmcf-ptype="general">다른 빅테크들도 마찬가지다. 유튜브 내부 사정을 잘 아는 구글 직원들은 "오픈AI가 유튜브 영상을 사용하고 있다는 사실을 알고 있었지만 막지 않았다"고 주장했다. 당시 구글도 유튜브 영상을 자체 AI 개발에 사용하고 있었는데, 오픈AI의 행동을 문제 삼을 경우 구글도 이를 활용하지 못하게 될 수 있다고 판단한 것으로 전해졌다.</p> <p dmcf-pid="Giwn6M9H7d" dmcf-ptype="general">메타도 온라인상 콘텐츠를 AI 훈련에 무단 사용했다. 뉴욕타임스는 "메타는 자사가 운영하는 페이스북·인스타그램 게시물뿐 아니라 소설과 에세이 등 저작물까지 무단으로 AI 훈련에 사용하고 있다"고 분위기를 전했다.</p> <figure class="figure_frm origin_fig" dmcf-pid="H1KtTGIiFe" dmcf-ptype="figure"> <p class="link_figure"><img alt="닐 모한 유튜브 CEO (사진=지디넷코리아 DB)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202404/08/ZDNetKorea/20240408091500884rdan.jpg" data-org-width="480" dmcf-mid="9ZmoQeVZ7E" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202404/08/ZDNetKorea/20240408091500884rdan.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 닐 모한 유튜브 CEO (사진=지디넷코리아 DB) </figcaption> </figure> <p dmcf-pid="X0fpG5SgUR" dmcf-ptype="general">이 같은 빅테크들의 움직임 속에 닐 모한 유튜브 CEO는 최근 오픈AI를 향해 경고장을 날렸다. 오픈AI의 영상 생성 AI 모델 '소라'가 유튜브 동영상으로 학습했다는 의혹이 불거진 탓이다.</p> <p dmcf-pid="ZzQq10Yc0M" dmcf-ptype="general">닐 모한 CEO는 지난 5일 블룸버그 오리지널과의 인터뷰에서 "크리에이터가 유튜브 플랫폼에 자신들의 창작물을 업로드할 때 기대를 하는 것 중 하나는 서비스 약관이 준수될 것이란 점"이라며 "서비스 약관은 영상 제목, 채널명 또는 크리에이터 이름과 같은 일부 유튜브 콘텐츠가 스크랩되는 것을 허용하는 것이지, 대본이나 영상 같은 것들이 다운로드되는 것은 허용하지 않는다"고 설명했다.</p> <p dmcf-pid="5HzXhTrRux" dmcf-ptype="general">그러면서 "오픈AI가 실제로 '소라'를 훈련하기 위해 유튜브 동영상을 사용했는지 여부에 대해선 직접 알지 못한다"며 "만약 그랬을 경우 유튜브의 이용약관을 명백히 위반한 것"이라고 덧붙였다.</p> <p dmcf-pid="1t9FyHCnuQ" dmcf-ptype="general">이번 일에 대해 오픈AI는 입장을 밝히지 않았다. 다만 미라 무라티 오픈AI 최고 기술 책임자(CTO)는 지난달 월스트리트저널과의 인터뷰에서 "소라가 유튜브, 페이스북, 인스타그램의 사용자 제작 동영상으로 학습했는지 여부는 확실하지 않다"고 밝힌 바 있다.</p> <p dmcf-pid="tnrLPR2XzP" dmcf-ptype="general">장유미 기자(sweet@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
1
풀카
900
2
논현동똥식이
700
3
올나잇스머프
500
4
사나존예보스
500
업체홍보/구인
더보기
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
[구인]
여왕벌에서 유능한 총판 파트너 모집합니다
[구인]
자택 알바 구합니다.(투잡/장기 가능)
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
N
N
N
N
N
N
채팅하기