로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
‘기생수:더 그레이’, 올해 상반기 ‘넷플 톱10’ 유일한 K콘텐츠
N
[실시간뉴스]
창원 최대 300㎜ 폭우, 경남 도로침수 등 비 피해 잇따라(종합)
N
[연예뉴스]
도경완♥장윤정子 연우, LA서 7살 동생두고 열차 탑승 "이럴애가 아닌데.."('내생활')
N
[연예뉴스]
'독립운동가 후손' 허미미, 직계 친척들과 첫 만남…뭉클 감동
N
[연예뉴스]
‘내생활’ 도경완♥장윤정, 도도남매 갈등에 충격
N
커뮤니티
더보기
[자유게시판]
집가는데 비가오네요
N
[자유게시판]
내일은 드디어 그날이네요.
N
[자유게시판]
퇴근 하시는분들
N
[자유게시판]
감튀 맞춰보실분
N
[자유게시판]
커담 땡겨서 나왔네요
N
제휴문의 @spostar
제휴문의 @spostar
목록
글쓰기
[IT뉴스]AI 데이터 ‘골드러시’
온카뱅크관리자
조회:
43
2024-05-03 03:02:07
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">사진 1~2달러, 영상 2~4달러, 문서는 1000자에 1달러 거래</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="ziURgjxp3D"> <figure class="figure_frm origin_fig" dmcf-pid="qVWb6xqyFE" dmcf-ptype="figure"> <p class="link_figure"><img alt="인공지능(AI) 일러스트. /연합뉴스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202405/03/chosun/20240503030209103nrsq.jpg" data-org-width="3000" dmcf-mid="7gyB8QzTpw" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202405/03/chosun/20240503030209103nrsq.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 인공지능(AI) 일러스트. /연합뉴스 </figcaption> </figure> <p dmcf-pid="BfYKPMBWpk" dmcf-ptype="general">생성형 인공지능(AI)을 개발하는 빅테크들은 뉴스뿐 아니라 AI 학습에 필요한 데이터라면 수단과 방법을 가리지 않고 긁어모으고 있다. 얼마나 많은 데이터를 확보하느냐가 AI의 성능을 결정하기 때문이다.</p> <p dmcf-pid="b4G9QRbY7c" dmcf-ptype="general">빅테크들은 AI 개발 초기에는 인터넷에서 무료로 사용할 수 있는 데이터들을 대량으로 사용했다. 데이터 종류도 가리지 않는다. 로이터는 “채팅 기록부터 오래된 소셜미디어의 개인 사진에 이르기까지 모든 것을 사용했다”고 했다. 현재 챗GPT처럼 질문을 넣으면 대답을 내놓는 ‘챗봇 시스템’은 최대 3조 단어에 달하는 디지털 텍스트를 통해 학습했다. 뉴욕타임스는 “이 정보량은 1602년부터 원고를 수집해 온 옥스퍼드 대학의 보들리언 도서관에 있는 단어의 두 배”라고 했다.</p> <p dmcf-pid="KPZfRJ2XzA" dmcf-ptype="general">저작권 문제로 사용 가능한 데이터들이 줄어들자 글로벌 빅테크들은 대가를 지불하면서 데이터를 수집하고 있다. 데이터 기업 ‘<span>디파인드.ai</span>’에 따르면 구매 기업과 콘텐츠 유형에 따라 다르지만, 일반적으로 사진은 한 장에 1~2달러, 영상은 2~4달러, 문서는 1000자에 1달러에 거래되고 있다고 한다. 오픈AI는 자체 개발한 음성인식 도구를 통해 100만 시간 이상의 유튜브 영상에서 텍스트를 모았다. 이는 오픈AI의 최신 AI 모델인 GPT-4 학습에 사용됐다. 이 때문에 생성형 AI의 ‘데이터 골드 러시’라는 말까지 나오고 있다.</p> <p dmcf-pid="9Q54eiVZ3j" dmcf-ptype="general">오픈AI의 경쟁사인 앤스로픽의 공동창업자 재러드 캐플런은 “학생이 책을 많이 읽어 많이 배우는 것처럼 대규모언어모델(LLM)도 데이터가 많을수록 성능이 좋아진다”고 했다. 하지만 AI 연구기관인 에포크는 “2026년이면 AI가 학습하지 않은 고품질 데이터가 모두 고갈될 것”이라는 전망을 내놓기도 했다.</p> <p dmcf-pid="2HNy13va3N" dmcf-ptype="general">빅테크들은 데이터의 한계를 ‘AI 합성 데이터’로 넘고 있다. 오픈AI의 경우 두 개의 AI 모델을 만들어, 하나는 새로운 데이터를 만들고 나머지 하나는 이 데이터가 정확한지를 판단하는 기술을 개발 중이다. 사람이 아닌 AI가 만들면 저작권 문제도 해결할 수 있다.</p> </section> </div> <p class="" data-translation="true">Copyright © 조선일보. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
1
혈마
700
2
올나잇스머프
700
3
풀카
600
4
여수짱똥깨
600
업체홍보/구인
더보기
[구인]
온카 정싸에서 유튜브 방송 BJ 구인중입니다
[구인]
클릭계열 빙고 최상부 카지노1.2% 동행파워볼2% 양방가능 부본사 파트너 모십니다.
[구인]
해외에서 업무 가능 하신 분 구인 합니다
[구인]
★★재택근무 장기적으로 함께하실팀원 모십니다★★
[구인]
다양한 경험의 개발자 구직 합니다. 안정적인 업체 원합니다.
지식/노하우
더보기
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
[카지노 노하우]
바카라 노하우
[카지노 노하우]
룰렛 시스템 가장 큰 팁!
[카지노 노하우]
기회가 온다면 잡으세요.
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
N
N
N
N
N
N
채팅하기