언론재단, AI 플랫폼과 언론사 제휴 동향 분석 간행물 발행…"국내 언론사, 선제적으로 뉴스 데이터 적정 가치 산정해야"
[미디어오늘 노지민 기자]
▲챗GPT를 이용해 생성한 이미지
AP통신을 시작으로 해외 미디어 기업과 오픈AI와 같은 거대언어모델(LLM·Large Language Model) 개발사의 제휴 소식이 전해지고 있다. 국내외를 막론하고 뉴스 무단 사용을 둘러싼 법적 공방 또한 치열하다. AI와 언론이 '이중적 관계'에 놓인 지금, 국내 언론사들이 선제적으로 뉴스 데이터의 적정 가치를 산정해야 한다는 제안이 나온다.
한국언론진흥재단은 9일 '2025 해외 미디어 동향 제1호-AI 플랫폼과 언론사의 제휴 동향'을 발간했다. 연합뉴스 데이터·AI전략팀을 지낸 김태균 기자가 작성을 맡았다.
지난 2023년 7월 오픈AI는 세계 주요 언론사와는 처음으로 오픈AI와의 데이터 사용권 계약을 발표했다. 오픈AI는 1985년까지의 과거 기사 아카이브 사용권을, AP통신은 일회성 금전 대가와 AI 기술 사용권을 받은 것으로 나타났다. AP통신은 오픈AI 기술 지원으로 장문의 기사를 짧게 요약하는 기술과 다국어 고객 채팅 서비스 등 연구를 추진 중이라 밝혔다. 이후 대형 미디어 그룹 중심으로 LLM 개발사와 해외 언론 계약 소식이 이어졌다.
이어진 계약에선 각 언론사가 자사 기사 노출을 조금씩 다른 방식으로 제한했다. 2023년 12월 오픈AI와 계약한 유럽 언론 그룹 악셀 슈프링어는 산하 매체 기사를 LLM 훈련용 데이터로 제공하되, 챗GPT는 기사의 짧은 요약이나 링크만 보여주고 원 기사는 뉴스 웹사이트에서 볼 수 있게 했다. 2024년 4월 역시 오픈AI와 계약한 영국 파이낸셜타임스(FT)도 챗GPT가 자사 기사의 요약, 일부 인용문, 링크만 쓸 수 있게 했다.
그해 5월 '닷대시 메레디스'(DDM), 뉴스코프, 복스 미디어, 디 애틀란틱 등과 오픈AI의 라이선스 협약이 이어졌다. 5년간 2억5000만 달러 규모 계약을 체결했다고 알려진 뉴스코프는, 최신 기사는 출고 후 일정 시간이 지난 뒤 챗GPT에 노출되도록 했다고 한다. 이 밖에 구글 '제미나이'가 AP통신의 최신 기사 검색 결과를 노출할 권리를 얻은 계약이 올해 1월 발표됐다.
▲자료=한국언론진흥재단 '2025 해외 미디어 동향-AI 플랫폼과 언론사의 제휴 동향'
이처럼 '대량의 우량 데이터'가 쌓인 대형 미디어 그룹 사이에서, 미국 시사 잡지 '디 애틀랜틱' 사례가 주목된다. 보고서는 “예컨대 미국의 유력지 워싱턴 포스트의 경영 내홍을 다룬 작년 6월자 기사는 분량이 A4지 기준으로 20장에 육박한다”며 “이렇게 희귀 주제에 관한 장문의 심층 텍스트는 AI 훈련에 별도의 값어치가 있다. LLM이 해당 주제에 대해 '아무 말 대 잔치'를 하지 못하도록 막고, 더 깊이 있게 사고할 수 있도록 해주는 길잡이 역할을 하기 때문”이라고 설명했다.
다른 한 쪽에선 언론계와 LLM 개발사간 소송전이 한창이다. 뉴욕타임스(NYT)는 2023년 12월 오픈AI와 마이크로소프트(MS)가 자사 기사를 무단으로 활용했다며 손해배상 소송을 냈다. AI가 지속적이고 끈질긴 질문을 받아 학습한 원본을 출력해내는 '역류(regurgitation)' 현상이, '변형적 이용'이라는 개발사 측 논리를 무너뜨리는 근거로서 확인되기도 했다. 2023년 이미지 판매 서비스 '게티이미지'도 이미지 생성 AI 업체 '스테빌리티 AI'에 저작권 소송을 제기한 바 있다. 뉴스코프 핵심 매체인 WSJ와 뉴욕포스트의 AI 검색 플랫폼 '퍼플렉시티'가 답변에 뉴스 콘텐츠를 무단 활용했다며 지난해 저작권 소송을 제기했다.
▲자료=한국언론진흥재단 '2025 해외 미디어 동향-AI 플랫폼과 언론사의 제휴 동향'
한국에선 네이버가 '하이퍼클로바' '하이퍼클로바X'에 네이버 뉴스 기사 데이터를 사용한 것으로 나타나면서 언론사들의 보상 요구에 직면했다. 2023년 지상파 방송사 연합체인 한국방송협회가 네이버에 뉴스 데이터 이용에 대한 보상을 요구했으나 진전이 없었고, 올해 1월 지상파 3사(KBS·MBC·SBS)가 네이버 상대로 저작권 침해 및 부정경쟁방지법 위반 혐의 손해배상 청구소송을 냈다. 한국신문협회의 경우 2월 네이버를 공정거래위원회에 제소했다.
보고서는 국내 언론사의 최우선 과제로 “데이터의 적정 가치 산정”이 필요하다고 진단했다. 한국의 개별 언론사 데이터는 LLM 개발사가 원하는 규모에 미치지 못한다는 평가에 더해, 중소형 언론사 기사를 헐값에 매집해 팔아 수익을 챙기는 '약탈적' 중간업자가 생겨날 우려도 지적했다. 결국 LLM에 최적화한 공동 뉴스 '아카이브' 설립 논의, 특정 이슈에 따른 학습이 가능한 내용 분류, 데이터 상품 개발 실력 등 역량 강화가 필요하다는 것이다. 2000년대 언론사가 네이버나 다음 등 포털에 진입하며 수익을 얻은 동시에 '포털 종속'을 겪은 문제가 반복될 가능성도 있다. 이미 해외 언론계에선 LLM과의 계약을 소위 '악마와의 계약'으로 부르기도 한다는 것이다.
언론계가 여러 난제를 마주한 지금, 자사 유료 서비스에서 자체 개발 LLM 도구를 개발한 미국 정치 매체 '폴리티코'가 눈여겨 볼 사례로 꼽힌다. 보고서는 “폴리티코 프로의 주요 고객은 워싱턴의 정관계 종사자들인데, 이들을 위해 AI가 손쉽게 정책 보고서 등을 만들어 준다”며 “LLM 업계와의 파트너십을 맺은 해외 언론사들은 자사 기사 데이터의 가치를 보호하는 동시에 AI 기업으로 진화하고자 안간힘을 쓰고 있다”라고 전했다.
Copyright © 미디어오늘. 무단전재 및 재배포 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.