로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
림흥거리서 대동강맥주…北으로 졸업여행 간 조선대 학생들
N
[실시간뉴스]
"노출 심하다" 아이 등하교 때…엄마 복장 논란 [어떻게 생각하세요]
N
[실시간뉴스]
세계인 입맛 잡은 'K-과자'…연간 수출액 사상 첫 1조 가능성
N
[실시간뉴스]
“연예인 아니세요? 자리 좀”…노홍철에 기내 좌석 바꿔달라한 승객
N
[실시간뉴스]
'김해 실시간 제네시스 아재'…남부지역 역대급 폭우 어땠길래
N
커뮤니티
더보기
[자유게시판]
소화좀 시켜주시고!!
[자유게시판]
라면에 김밥조지네효
[자유게시판]
오늘은 어떤 개쩌는 점심을
[자유게시판]
비 장난아니다...
[자유게시판]
날씨가 많이 풀렸내요
제휴문의 @spostar
제휴문의 @spostar
목록
글쓰기
[IT뉴스]AI 학습 사이트 10개 중 5개가 언론사 사이트
온카뱅크관리자
조회:
30
2024-05-08 14:55:44
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="78gOsNXDMr"> <p dmcf-pid="zU6goQOJMw" dmcf-ptype="general"><strong>[AI 미디어 파도] 워싱턴포스트, AI 학습에 사용되는 1000만 개 웹 분석<br> 10위 안에 뉴욕타임스·LA타임스·가디언·포브스·허프포스트</strong></p> <p dmcf-pid="qBRcAdSgJD" dmcf-ptype="general">[미디어오늘 <span>박서연 기자</span>]</p> <figure class="figure_frm origin_fig" data-idxno="446997" data-type="photo" dmcf-pid="Bcv3FyVZeE" dmcf-ptype="figure"> <p class="link_figure"><img alt="▲ⓒDALL·E" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202405/08/mediatoday/20240508145548238ypry.jpg" data-org-width="600" dmcf-mid="UobRM9c6Ls" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202405/08/mediatoday/20240508145548238ypry.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> ▲ⓒDALL·E </figcaption> </figure> <div dmcf-pid="bDWUpG8tek" dmcf-ptype="general"> <p>테크 기업들이 인공지능(AI) 모델을 개발하는 과정에서 언론사 콘텐츠를 적극적으로 학습하고 있다는 연구 결과가 발표됐다.</p> </div> <p dmcf-pid="Kp8oLPsdec" dmcf-ptype="general">4월19일 미국 일간지 워싱턴포스트(WP)는 <챗GPT와 같은 AI를 똑똑하게 만드는 웹사이트의 비밀목록> (Inside the secret list of websites that make AI like ChatGPT sound smart)이란 제목의 기사를 보도했다. 기사에 따르면 워싱턴포스트가 AI 학습에 사용되는 거대 데이터 세트인 구글 'C4'의 1000만 개 이상 웹사이트를 분석한 결과, AI에 가장 많은 정보를 제공한 웹사이트 10개 중 5개가 언론사 사이트인 것으로 나타났다. 미국 뉴욕타임스가 4위에 올랐고, 미국 LA타임스가 6위, 영국 가디언이 7위, 미국 포브스가 8위, 미국 허프포스트가 9위를 기록했다.</p> <p dmcf-pid="9sXqz5xpdA" dmcf-ptype="general">30위 안으로 살펴도 절반 정도가 언론사 콘텐츠였다. 미국 워싱턴포스트는 11위에 올랐다. 이어 미국 비즈니스인사이더가 17위, 미국 시카고트리뷴 18위, 미국 디 애틀랜틱 20위, 카타르 알자지라 24위, 영국 일간지 텔레그래프 28위, 미국 공영방송 NPR 29위, 영국 데일리메일 30위 순이었다.</p> <figure class="figure_frm origin_fig" data-idxno="446995" data-type="photo" dmcf-pid="2lF290Jqnj" dmcf-ptype="figure"> <p class="link_figure"><img alt="▲워싱턴포스트 화면 갈무리. AI가 학습에 활용한 웹사이트 10곳 중 5곳이 언론사다." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202405/08/mediatoday/20240508145550332nrmm.jpg" data-org-width="600" dmcf-mid="umyp0Y41dm" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202405/08/mediatoday/20240508145550332nrmm.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> ▲워싱턴포스트 화면 갈무리. AI가 학습에 활용한 웹사이트 10곳 중 5곳이 언론사다. </figcaption> </figure> <div dmcf-pid="Vv0fVUnbnN" dmcf-ptype="general"> <p>순위 공개에 앞서 워싱턴포스트는 “챗봇은 사람처럼 생각할 수 없다. 챗봇은 자신이 하는 말을 실제로 이해하지 못한다. 챗봇을 구동하는 AI가 인터넷에서 스크랩한 방대한 양의 텍스트를 수집했기 때문에 사람의 말을 모방할 수 있다”며 “이 텍스트는 AI가 구축되는 과정에서 세상에 대한 주요 정보 소스이며 사용자에게 반응하는 방식에 영향을 미친다”고 밝혔다.</p> </div> <p dmcf-pid="fdDyTrphia" dmcf-ptype="general">이어 워싱턴포스트는 “기술 기업들이 AI에 어떤 데이터를 제공하는지 비밀에 부쳐왔다. 그래서 WP는 이러한 데이터 세트 중 하나를 분석해 AI 학습 데이터에 들어가는 독점적이고 개인적이며 종종 불쾌감을 주는 웹사이트 유형을 완전히 공개하기 시작했다”고 밝혔다. 챗GPT 개발사인 오픈AI는 어떤 데이터 세트를 사용하는지 공개하지 않고 있는 상황.</p> <p dmcf-pid="4U6goQOJRg" dmcf-ptype="general">앞서 1000만 명 이상의 유료 독자를 확보한 뉴욕타임스는 지난해 12월 오픈AI와 마이크로소프트를 상대로 저작권 침해소송을 제기했다. NYT는 소송을 제기하면서 “뉴욕타임스가 엄청난 비용을 들여 제작한 저널리즘 콘텐츠를 무료로 활용하면서 이에 대한 적절한 보상도 없이 대체 상품을 만들어내고 있다”고 비판했다.</p> <p dmcf-pid="8QjhCc1mno" dmcf-ptype="general">1000만 개 학습 사이트 중 '뉴스 및 미디어' 카테고리는 전체 카테고리에서 3위를 차지했다. 카테고리 1위는 '비즈니스 및 산업', 2위는 '기술'이었다. 워싱턴포스트는 “전체 상위 10개 사이트 중 절반이 뉴스 매체였다. 아티스트 및 크리에이터와 마찬가지로 일부 언론사들은 기술 기업이 허가나 보상 없이 콘텐츠를 사용하는 것에 대해 비판했다”고 보도했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 미디어오늘. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
온카 정싸에서 유튜브 방송 BJ 구인중입니다
[구인]
클릭계열 빙고 최상부 카지노1.2% 동행파워볼2% 양방가능 부본사 파트너 모십니다.
[구인]
해외에서 업무 가능 하신 분 구인 합니다
[구인]
★★재택근무 장기적으로 함께하실팀원 모십니다★★
[구인]
다양한 경험의 개발자 구직 합니다. 안정적인 업체 원합니다.
지식/노하우
더보기
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
[카지노 노하우]
바카라 노하우
[카지노 노하우]
룰렛 시스템 가장 큰 팁!
[카지노 노하우]
기회가 온다면 잡으세요.
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
N
N
N
N
N
N
채팅하기