로그인
보증업체
스포츠중계
스포츠분석
먹튀사이트
지식/노하우
판매의뢰
업체홍보/구인
뉴스
커뮤니티
포토
포인트
보증카지노
보증토토
보증홀덤
스포츠 중계
기타
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
실시간뉴스
스포츠뉴스
연예뉴스
IT뉴스
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[실시간뉴스]
'투표지 부족 사태' 대학가 규탄 확산…"무효 선거"(종합)
N
[실시간뉴스]
예술활동증명 신청 폭증…최희영 "현실 맞게 못바꾸면 실패"(종합)
N
[실시간뉴스]
'12대4' 성적표에도..정청래 연임 '빨간불'·장동혁 당권 유지 전망
N
[실시간뉴스]
코스피, '역대 두번째' 외인 순매도에 8,630선 후퇴…코스닥 2%대↑(종합)
N
[IT뉴스]
“메타, 눈앞 음식 칼로리 계산해줘”…AI 안경이 답했다
N
커뮤니티
더보기
[자유게시판]
드디어 금요일이군요
[자유게시판]
오늘 다저스 어떻게 생각하시나요
[자유게시판]
하아 댓노
[자유게시판]
식곤증지립니다요
[자유게시판]
벌써 불금이네요
목록
글쓰기
[IT뉴스][AI데이터 난맥상下] ‘마크다운’ 전환 시작했지만…‘에이전트 친화 정책’ 갈길 멀다
온카뱅크관리자
조회:
13
2026-06-04 15:17:30
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="Ktr22IyOSX"> <div contents-hash="34eb09bcca8cd20cb25944e1b6ca70353dc490f9b491545492aa1287b5c9bd5a" dmcf-pid="9FmVVCWIvH" dmcf-ptype="general"> <strong>‘특화 AI’ 모델 개발 중요성이 대두되고 있는 현시점에서 AI를 학습시키기 위한 데이터는 모든 산업 분야의 ‘생명수’로 인식되고 있다. 가장 주목받는 것은 정부 공공데이터다. 각종 형식이 정형화돼 있으며 대규모로 구축돼 있기 때문이다. 문제는 데이터 정책이 부처별로, 법률별로 산개돼 있어 실제 현장에서는 필요한 데이터를 찾고 결합·활용하는 과정에서 혼선과 병목이 반복되고 있다는 점이다. 관련해 정부에서도 최근 ‘데이터관계장관회의’를 출범하고 산개된 데이터 정책 봉합에 나섰다. <디지털데일리>가 현시점 데이터 정책 문제점을 짚고 관련해 전문가 및 업계 관계자의 목소리를 들어봤다. <편집자 주></strong> </div> <figure class="figure_frm origin_fig" contents-hash="19dbff41a161b987928c07c0523a5a10e79d82825299c9a8c593a6cb49295a01" dmcf-pid="23sffhYClG" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/04/552796-pzfp7fF/20260604151636404ekmg.png" data-org-width="640" dmcf-mid="bAQWWRoMyZ" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/04/552796-pzfp7fF/20260604151636404ekmg.png" width="658"></p> </figure> <p contents-hash="ae814c5c67f1181ac47637fd0e47753fe9fbdd03c784705ae1912dd0a66adf15" dmcf-pid="Vnqmm9PKlY" dmcf-ptype="general">[디지털데일리 오병훈기자] AI 에이전틱 시대를 맞아 정부 공공데이터 파일 형식을 AI 친화적으로 전환하는 것을 넘어서 AI 에이전트가 직접 파일을 찾아서 쉽게 읽고 분석할 수 있는 ‘환경’을 조성하는 것이 더 중요하다는 목소리가 커지고 있다.</p> <p contents-hash="2b03133dff5e2eb17a37b6e6a4e8f0e484cec607488ed5664af8613f0d7e18c6" dmcf-pid="fLBss2Q9SW" dmcf-ptype="general">정부에서는 공공데이터 파일 형식을 기존 한글문서 파일(.whp)에서 마크다운 형식으로 전환하는 작업을 본격화했다. 하지만 업계에서는 이 외에도 파일 공개 방식이나, 접근 환경 등이 전반적으로 개선될 필요가 있다는 의견을 냈다. 사람 개입을 최소화하고, 공공데이터 접근 체계를 단순화하는 등 다양한 개선 작업이 이어져야한다는 시각이다.</p> <p contents-hash="a9435105bf82237ac3229be27b7a06be760d61b4abc45268bf4b2bfbc2f3aff3" dmcf-pid="4obOOVx2ly" dmcf-ptype="general">전문가들은 현재 데이터 구축의 문제점을 단순히 ‘기관의 잘못’으로 보기보다 구축 업무 체계의 문제점으로 봐야 한다고 역설했다. 공공데이터 구축 인력이나 법적 책임 등에 대한 기반이 약한 상황에서 기관을 압박하는 식의 공공데이터 구축은 해결책이 될 수 없다는 평가다.</p> <p contents-hash="4273caf163fe843f4b88643aba6e00eb75e168dc75f22985fc541bd03a4252ee" dmcf-pid="8gKIIfMVyT" dmcf-ptype="general"><strong>◆마크다운 형식 확산 기대…업계 “AI 친화적 포맷 표준화 시급”</strong></p> <p contents-hash="e74bf5e4027ab51bbb3350d2252b3a4a59fceb2f044a1406d87fd4f6b7c7741d" dmcf-pid="6a9CC4RfTv" dmcf-ptype="general">현재 정부가 개방하는 공공데이터는 정확한 단어 사용과 절제된 표현, 핵심 위주의 설명으로 데이터 자체의 질적 수준은 매우 높은 편이라는 게 업계 분석이다. 하지만 이를 AI 모델 학습에 즉각적으로 투입하기에는 파일 포맷이라는 현실적인 장벽이 존재한다는 비판이 나온다.</p> <p contents-hash="c76ab256e5ad1da8854999dc8c9077bd51da2f5221159483de22a5768855ea80" dmcf-pid="PN2hh8e4TS" dmcf-ptype="general">구체적으로 정부 데이터 상당수가 여전히 .hwp 형식으로만 제공되거나 표의 셀 병합 등 구조가 복잡해 AI가 즉각적으로 이해하도록 가공하기 어렵다는 것이다. 이 때문에 데이터 정제를 위해서는 별도의 ‘파서(Parser)’ 프로그램을 개발해 사용해야 하며, 변환 이후에도 내용이 올바르게 추출되었는지 사람이 일일이 검수하는 과정을 거쳐야 하는 문제가 있다.</p> <p contents-hash="be4127e912d8a3e06a39d93bfc8e9811099b071c6e8caacd28f4b4db67a738ca" dmcf-pid="QjVll6d8vl" dmcf-ptype="general">업계 관계자는 “공공 데이터 생산자마다 형식이 다르고 표준화가 안 돼 있어 데이터별로 포맷 처리를 위한 개발 시간과 비용이 지속적으로 발생하고 있다”고 말했다.</p> <p contents-hash="dd64e3164916574b47272d31e9a98d3b69f7cd0aeb3dd6e61caa7a7329060488" dmcf-pid="xAfSSPJ6Sh" dmcf-ptype="general">정부에서도 과기정통부, 국가인공지능전략위원회를 중심으로 파일 형식 전환 작업에 속도를 내고 있다. 기존 .whp나 .pdf 파일 외에 AI 친화적인 마크다운(.md) 형식으로 데이터를 추가 공개하며 빠른 변화를 시도하고 있다. 마크다운 형식의 문서는 내부 데이터가 체계적으로 구조화돼 있어 AI가 내용을 쉽게 파악하고 별도의 정제 작업 없이도 학습에 바로 활용할 수 있다는 확실한 장점이 있다.</p> <p contents-hash="0f3e7b24a5f420868c724a6346d506089ca35522aeff7f901291ba6c71abec3b" dmcf-pid="yGAzzDCElC" dmcf-ptype="general">업계에서는 이러한 마크다운 전환이 범정부 차원의 표준화로 정착되어야 한다고 입을 모으고 있다.</p> <p contents-hash="e333b392168aa8c148c9c204ed41e1f54566998fc90fa43d5af4968fd92d4cc1" dmcf-pid="WHcqqwhDTI" dmcf-ptype="general">또 다른 업계 관계자는 “영국의 경우 ‘거브스픽(govspeak)’이라는 마크다운 기반 전용 문서 포맷을 제정해 정부 문서 작성 단계부터 이를 적용하게 함으로써 AI 학습에 즉시 활용하고 있다”며 “한국 역시 이러한 적극적인 벤치마킹이 필요하다”고 강조했다.</p> <p contents-hash="0717320d2663486bea2ee9329a2d652dfd3e1283f605af45bf47c36535018d03" dmcf-pid="YXkBBrlwSO" dmcf-ptype="general"><strong>◆AI에이전틱에 더 가깝게…데이터 접근 체계 개선 필요성</strong></p> <p contents-hash="e63145f610c5b94a5da47e3b896b13746088b7fd160a1fed47ea19f0c52cec10" dmcf-pid="GZEbbmSrCs" dmcf-ptype="general">단순한 포맷 변환을 넘어, 진정한 ‘AI 고속도로’ 데이터 생태계를 조성하기 위해서는 실시간 데이터 연동과 복잡한 규제 완화 등 전반적인 접근 체계가 개선돼야 한다는 목소리도 크다. 업계가 지적하는 핵심 문제는 크게 ‘데이터 최신성’ 확보와 라이선스 문제로 요약된다.</p> <p contents-hash="46e7e649dbf17814497d9694d3360586b7c069261b3ca5871fa4967280d7566c" dmcf-pid="H5DKKsvmWm" dmcf-ptype="general">구체적으로 데이터 최신성과 관련해서는 실시간 데이터 연동 및 AI 자동화 환경 미비 문제가 언급됐다. 현재 공공데이터포털 등에서 공개되는 공공 집합데이터는 꾸준히 제공되고는 있으나 실시간 데이터가 부족하다는 비판이다. 공공데이터 대부분 1~2개월 시차를 두고 지연 공개되고 있다는 것이다.</p> <p contents-hash="8afc78755af8fbd6acaf036030991edcc9cd6fdf2a72693256bf146a91731f7f" dmcf-pid="X1w99OTsCr" dmcf-ptype="general">이는 기업 입장에서 시시각각 변하는 시장 상황 대응을 더디게 만든다. 실시간 비즈니스 서비스가 생명인 시장에서 발목을 잡을 수 있다는 우려다.</p> <p contents-hash="a076ff695228101225157fc225c510f5984d2ad7b47b32d54a617306517befec" dmcf-pid="Ztr22IyOlw" dmcf-ptype="general">업계 관계자는 “공공 집합데이터는 꾸준히 공개되고 있지만 실시간 데이터는 사실상 부족하고 대부분 지연 공개되는 경우가 많다”며 “사업적으로 활용하기에는 한계가 있고, 데이터마다 표준화가 이뤄지지 않아 개발 과정에서 시간과 비용이 반복적으로 발생하는 것이 현실”이라고 평가했다.</p> <p contents-hash="12dda96aac5b38c80f8b20563fcae2ae375553b276a2f2b72950255b761e4241" dmcf-pid="5FmVVCWISD" dmcf-ptype="general">아울러 데이터 공급 환경도 AI 에이전트 시대에 맞게 변해야 한다는 지적도 나온다. 사람이 데이터를 직접 다운로드 받아 AI에게 떠먹여 주는 현재의 수동적 방식에서 벗어나야 한다는 것이다.</p> <p contents-hash="3e92236bb68dcd22aecfaab1f3291836fac94351ab38581b0e002375483fff32" dmcf-pid="13sffhYCTE" dmcf-ptype="general">또 다른 업계 관계자는 “AI가 직접 최신 데이터를 가져가서 사용할 수 있도록 모델 컨텍스트 프로토콜(MCP) 등의 기능이 필수적으로 제공돼야 한다”며 “우후죽순 공개되는 MCP 환경에서 심각한 보안 위협을 막기 위해 정부 차원의 공인 및 인증 등 신뢰성 확보가 선행되어야 한다”고 설명했다.</p> <p contents-hash="682e06298f02a4328e1c617757a60070f5bbaec8a9d1cff4e892c5dc09663b1d" dmcf-pid="t3sffhYCTk" dmcf-ptype="general">MCP는 AI 모델이나 에이전트가 외부 데이터, 업무 시스템, 도구와 표준화된 방식으로 연결될 수 있도록 하는 통신 규격이다. AI가 사용자의 별도 다운로드나 복사·붙여넣기 없이 필요한 데이터를 직접 조회하고 활용할 수 있도록 돕는 연결 체계로 볼 수 있다.</p> <p contents-hash="b3e5b2e3753f67545a8cfd8aa722aaeae336d51db778037ed75c36fd495706ce" dmcf-pid="F0O44lGhhc" dmcf-ptype="general">공공데이터 라이선스 제도 문제점도 시급한 개선 사항으로 꼽힌다. 현재 우리나라 정부가 제공하는 공공데이터에는 제1유형부터 제4유형까지 각각 상이한 ‘공공누리’ 이용 조건이 부착돼 있다는 것이 업계 설명이다. 기업 입장에서는 대량 데이터를 수집할 때마다 사용 목적에 따라 활용 가능 여부를 일일이 확인하고 폐기하는 번거로운 검수 작업을 거쳐야 한다.</p> <p contents-hash="16bf54d2299a4530e8c7670c0d26991baafc8a4c950ae65963ad1cb2e9510b62" dmcf-pid="3pI88SHlSA" dmcf-ptype="general">업계 전문가는 “국가 AI 경쟁력 강화를 위해서는 적어도 AI 학습 목적에 한해서만큼은 공공데이터를 자유롭게 활용할 수 있도록 일괄적인 예외 조항을 두는 것이 시급하다”고 말했다.</p> <p contents-hash="c1afe42aa2c11e3a841de9417357d70c13e2d9c9425c579f293a9266e6c792f1" dmcf-pid="0UC66vXShj" dmcf-ptype="general">물론 라이선스 문제와 관련해서는 정부도 이 같은 문제를 인식하고, 최근 신설된 데이터 관계장관회의 안건을 통해 ‘공공누리 AI 유형 신설 및 부착 의무화’ ‘공정이용 가이드라인 마련’ 등 제도 합리화 계획을 밝힌 바 있다.</p> <p contents-hash="dfeec06afecb501e4ab1a4cea01ef1d8ea960e482d3b201789429af6abac9f2b" dmcf-pid="puhPPTZvhN" dmcf-ptype="general">다만 이 계획이 실질적으로 효과를 내기 위해선 공공기관의 데이터 책임소재 등 체계 전반에 산적한 문제를 해결하는 우선이라는 지적도 나온다. 공공기관을 ‘데이터를 제대로 개방하지 않는 문제기관’으로만 보는 접근은 적절치 않다는 것이다. 특히 기관의 체질적인 문제, 예컨대 ‘데이터 전문인력 부족’ ‘순환보직’ ‘낮은 데이터 직무 위상’ ‘외주 의존’ 등을 먼저 해결할 필요가 있다는 시각이다.</p> <p contents-hash="7da273f434ace41908fc2b47e11776163966f7c0efe7097a57987c5897dc3d0d" dmcf-pid="U7lQQy5Tla" dmcf-ptype="general">김숙경 한국과학기술원(KAIST) 기술경영학부 교수는 “현재 정부부처와 공공기관의 데이터 업무에는 불명확한 책임소재와 핵심성과지표(KPI) 문제가 복합적으로 존재한다”며 “기관이 소극적인 것은 단순한 태도 문제가 아니라 합리적 방어 행동일 수 있다는 점을 감안해야 한다”고 말했다.</p> <p contents-hash="b93d1196269209bc4fe3e5254207aa7b8b11f511e40eae8180bffd559feaf8bb" dmcf-pid="uzSxxW1yyg" dmcf-ptype="general">이어 “정부는 기관을 압박하기보다 전문가 지원, 법적 면책, 표준 계약, 데이터 제공 비용 보전, 고품질 데이터 제품에 대한 포상, 실질적 활용성과 중심 KPI를 통해 기관이 안전하게 데이터를 제공하고 활용할 수 있도록 해야 한다”고 강조했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털데일리. All rights reserved. 무단 전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기