로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
“호감 있어요” 짝 찾는 40대 남녀, 경쟁 뚫고 간다는 곳 어디?
N
[연예뉴스]
부부의 음악 교감… 린·이수, '음' 오늘(7일) 발매
N
[연예뉴스]
"불러낸 내 우주를 봐"…'슈퍼노바' 켄지 음악, '이머시브 비주얼테크 아트'로
N
[연예뉴스]
‘DNA 러버’ 최시원 “시원섭섭하단 말로 부족…시청자에 감사” 종영소감
N
[연예뉴스]
‘보디빌더’ 김강민, 배우 전격 전향…이시영 소속사와 전속 계약[공식]
N
커뮤니티
더보기
[자유게시판]
일욜출근...
N
[자유게시판]
피곤하네요 세수한번 해야겠습니다
[자유게시판]
당충전
[자유게시판]
식사들은
[자유게시판]
맛점들 하세요
제휴문의 @spostar
제휴문의 @spostar
목록
글쓰기
[IT뉴스][AI 데이터 고갈위기]'데이터 부족하면 직접 만든다?'…주목 받는 합성데이터
온카뱅크관리자
조회:
28
2024-06-26 07:30:21
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">AI 붐에 수요 못 따라 가는 데이터 공급<br>가상으로 만들어낸 합성데이터 관심 ↑<br>성능 저하·다양성 부족 등 부정적 시선도</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="pSmF08vauM"> <figure class="figure_frm origin_fig" dmcf-pid="UHSzBeXDUx" dmcf-ptype="figure"> <p class="link_figure"><img alt="[이미지 출처=로이터연합뉴스]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202406/26/akn/20240626073022899ogjd.jpg" data-org-width="745" dmcf-mid="FPmF08va0d" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202406/26/akn/20240626073022899ogjd.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> [이미지 출처=로이터연합뉴스] </figcaption> </figure> <p dmcf-pid="u6KgNlP3pQ" dmcf-ptype="general">인공지능(AI) 학습에 필요한 데이터 확보가 한계를 보일 것이란 전망이 나오면서 인위적으로 만들어낸 합성데이터가 주목받고 있다. 허구의 데이터를 이용해 AI 학습을 하는 건데, 성능 저하 등이 나타날 수 있다는 부정적인 의견도 제기되고 있다.</p> <p dmcf-pid="7Gl7qRHE7P" dmcf-ptype="general">한국데이터산업진흥원이 지난달 발표한 '2023 데이터산업현황조사 보고서'에 따르면 지난해 기준 국내 데이터산업 시장은 전년 대비 4.6% 성장한 27조1513억원 규모인 것으로 조사됐다. 2018년까지만 해도 시장 규모가 15조5684억원 수준이었지만 5년 만에 11조5000억원 넘게 늘었다. 국내 데이터산업 시장은 매년 평균 12.6%의 성장이 전망됐는데 2028년에는 시장 규모가 51조1413억원에 육박할 것으로 파악됐다. 글로벌 시장조사 기관 360아이리서치는 전세계 AI 모델 개발에 사용되는 학습 데이터세트의 시장 규모는 매년 26% 넘게 성장할 것으로 전망했다.</p> <figure class="figure_frm origin_fig" dmcf-pid="zgeOCtaVu6" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202406/26/akn/20240626073024241wmji.jpg" data-org-width="745" dmcf-mid="3BRsI1g20e" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202406/26/akn/20240626073024241wmji.jpg" width="658"></p> </figure> <p dmcf-pid="qd6EwGJqF8" dmcf-ptype="general">합성데이터에 대한 관심은 데이터 수요만큼 공급이 따라가지 못할 것이라는 우려가 반영된 것으로 보인다.</p> <p dmcf-pid="Bd6EwGJq74" dmcf-ptype="general">합성데이터는 AI 학습용으로 만들어낸 가상의 데이터로, 크게 '부분'과 '완전' 합성데이터로 구분된다. 부분 합성데이터는 실제 데이터 중 일부에 합성 정보를 입히는 방식으로 만들어진다. 민감 정보를 보호에 용이하다.</p> <p dmcf-pid="bvs3p6TN3f" dmcf-ptype="general">완전 합성데이터는 새로운 정보를 생성하는 것을 뜻한다. 허구지만 실제와 동일한 통계 속성 등을 사용할 수 있어 실제 데이터를 사용했을 때와 유사한 결론을 얻을 수 있다.</p> <p dmcf-pid="KOkX59IiUV" dmcf-ptype="general">합성데이터 도입에 찬성하는 진영에선 필요에 따라 무제한으로 데이터를 생성해낼 수 있다는 점을 높게 평가한다. 개인정보에 민감한 금융, 의료 등 분야에 데이터를 제공할 수 있다는 점을 내세운다. 글로벌 시장조사기관 가트너는 향후 2030년에는 AI 학습에 실제보다 합성데이터를 사용하는 비중이 더 높을 것으로 내다봤다. 예를 들어 자율주행 모델 개발에서 합성데이터 사용 빈도는 증가하고 있다. 이는 실제 교통사고 데이터를 확보하기가 어렵기 때문인데, 합성데이터로는 3D 구현도 가능하다.</p> <p dmcf-pid="9CD5tVhL02" dmcf-ptype="general">국내 AI 데이터 스타트업인 셀렉트스타의 황민영 부대표는 "일반적인 방법으로 수집할 수 있는 데이터는 점차 고갈되는 만큼 합성데이터 의존이 점차 증가할 것으로 예상된다"고 말했다.</p> <p dmcf-pid="2cLSTUkP39" dmcf-ptype="general">인위적으로 만들어낸 만큼 합성데이터에도 부정적 시선이 존재한다. 실제가 아니다 보니 품질 문제가 생길 수 있다는 것이다. 또 잘못 설계된 합성데이터를 AI 학습에 활용할 경우 현실을 제대로 반영하지 못할 가능성도 농후하다. 오류가 있는 데이터가 확대 재생산돼 AI 분야에 쓰이게 되면 성능 감소에 이어 왜곡, AI 모델이 부정확한 답변을 하는 할루시네이션 현상 등도 발생할 수 있다.</p> <p dmcf-pid="V6KgNlP37K" dmcf-ptype="general">김명주 국제인공지능윤리협회장(서울여대 바른AI연구센터장)은 "AI가 만든 합성데이터를 다음 세대 AI 모델이 활용했을 때 이전보다 성능이 더 떨어질 수 있다는 실험 결과도 있다"며 "합성데이터를 사용한 AI 모델이 다수의 의견을 차지하게 되면 다양성의 상실이 나타날 수 있다"고 설명했다. 이어 "AI 때문에 인류의 문명이 획일화될 수 있다는 점에 대한 경각심도 필요하다"고 덧붙였다.</p> <p dmcf-pid="fU58PjuSFb" dmcf-ptype="general">이정윤 기자 leejuyoo@asiae.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 아시아경제. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
온카 정싸에서 유튜브 방송 BJ 구인중입니다
[구인]
클릭계열 빙고 최상부 카지노1.2% 동행파워볼2% 양방가능 부본사 파트너 모십니다.
[구인]
해외에서 업무 가능 하신 분 구인 합니다
[구인]
★★재택근무 장기적으로 함께하실팀원 모십니다★★
[구인]
다양한 경험의 개발자 구직 합니다. 안정적인 업체 원합니다.
지식/노하우
더보기
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
[카지노 노하우]
바카라 노하우
[카지노 노하우]
룰렛 시스템 가장 큰 팁!
[카지노 노하우]
기회가 온다면 잡으세요.
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
N
N
N
N
N
채팅하기