AI 학습 '무단 사용' 저작권 소송 확산
빅테크, 비용·시간 부담에 '공정 이용' 주장
"옵트아웃 등 대안도 근본적 해결책은 아니야"
게티뱅크 제공
생성형 인공지능(AI) 학습을 둘러싼 저작권 소송이 이어지고 있지만 빅테크 기업들과 창작자들의 입장 차는 좀처럼 좁혀지지 않는 모양새다. 창작자들은 정당한 대가 없는 AI 학습이 예술·창작 시장을 침해한다고 반발하는 반면 AI 기업들은 산업 전반의 발전을 위해 데이터 활용은 자유롭게 이뤄져야 한다고 맞서고 있다. 최근 '옵트아웃'(opt-out) 등 대안이 거론되고 있지만 이 역시 완전한 해결책은 아니라는 지적이 나오면서 저작권 문제를 둘러싼 논란은 더욱 뜨거워질 전망이다.
◇빅테크 상대 저작권 소송 잇따라= 9일 정보기술(IT)업계에 따르면 최근 미국에서는 온라인 커뮤니티 레딧이 AI 스타트업 앤스로픽을 상대로 캘리포니아 법원에 소송을 제기했다. 레딧 측은 앤스로픽이 레딧 사용자들의 데이터를 라이선스 계약 없이 상업적 목적으로 무단 사용했다고 주장했다. 이미 오픈AI, 구글과는 데이터 라이선스 계약을 맺었지만 앤스로픽과는 협상이 결렬된 뒤에도 AI가 자사 사이트에 접근했다는 것이다.
레딧측은 "앤스로픽은 실제로 레딧 사용자들의 개인 데이터를 동의를 구하지 않고 의도적으로 AI 학습에 사용했고 이는 스스로를 'AI 업계의 정의로운 기업(white knight)'으로 내세우는 앤스로픽의 행태와는 정면으로 배치된다"며 "레딧은 열린 인터넷을 지지하지만, 무단 착취까지 허용할 수는 없다"고 강조했다. 이에 대해 앤스로픽 측은 "레딧의 주장에 동의하지 않는다"며 "적극적으로 방어하겠다"고 입장을 밝혔다.
뉴욕타임스(NYT)는 자사 기사를 AI 학습에 무단 활용했다며 오픈AI와 마이크로소프트(MS)를 상대로 지난해 말 소송을 제기했고, 지난달에는 미국 유명 작가 12명이 메타(페이스북 모기업)를 상대로 AI 훈련에 각종 전자책과 논문을 무단 사용했다고 고소한 사건의 재판이 열린 바 있다.
◇빅테크는 '공정 이용' 주장= 이처럼 줄 소송이 이어짐에도 빅테크 기업들이 학습 자료를 무단으로 사용하는 이유는 결국 시간과 비용 문제 때문이다. AI 성능을 높이려면 방대한 양의 고품질 학습 데이터가 필수지만 이를 정식 라이선스로 확보하려면 막대한 비용과 시간이 든다. AI 기업들은 모델 개발에만도 이미 천문학적인 비용을 쏟아붓고 있다.
양질의 데이터가 점점 고갈되고 있다는 점도 또 다른 이유로 꼽힌다. 고품질 학습 데이터는 신뢰할 수 있는 AI 개발의 핵심이지만 공급은 한정적이다. AI 연구기관 에포크AI에 따르면 AI 학습 속도가 데이터 증가 속도를 앞지르면서 오는 2026년부터 학습용 데이터가 소진되기 시작할 것으로 전망된다.
빅테크 기업들은 무단 활용이 불가피하다는 논리로 '공정 이용'을 내세우고 있다. 공정 이용은 미국 저작권법에 명시된 개념으로 공적인 목적이 있을 경우 저작권자의 허락 없이도 저작물을 활용할 수 있도록 한 제도다. 김명주 AI안전연구소장(서울여대 정보보호학과 교수)은 "기존 AI는 주로 분류나 예측에 그쳐 공정 이용 주장이 가능했지만 생성형 AI는 출력 결과가 직접 생성되면서 학습한 저작물과 유사성이 드러나고 있다"며 "AI 학습이 인류 전체에 도움이 되는 방향으로 활용될 때 공정 이용이 성립할 수 있지만 현재는 소수 기업의 이익 중심으로 AI 학습이 이뤄지고 있어 사회적 합의가 필요하다"고 강조했다.
◇옵트아웃은 근복적 한계=이에 AI 산업 발전과 저작권 사이의 균형점으로 비용 보상 합의와 옵트아웃 방식 등이 논의되고 있다. 옵트아웃은 저작권자가 자신의 콘텐츠가 AI 학습에 활용되지 않도록 사전에 제외(배제) 요청할 수 있는 제도다. 다만 이미 학습이 완료된 데이터에는 적용이 어렵고 수많은 저작물에 일일이 적용하기 힘든 한계가 있어 근본적인 해결책으로 보기는 어렵다는 지적이 나온다. 김 소장은 "옵트아웃 제도 또한 현실적으로 모든 저작권자와 일일이 협의하기 어려운 문제가 있다"면서 "최근에는 창작자들도 자신의 작업물에 AI를 다시 활용하는 경우가 많은데, 이렇게 되면 오히려 창작자도 AI 기업에 비용을 지불해야 하는 상황이 발생할 수 있다. AI 저작권 생태계가 복잡하게 얽혀 있어 법적 판결이 나오기 전까지는 쉽게 해결되기 어려울 것"이라고 설명했다. 유진아기자 gnyu4@dt.co.kr
Copyright © 디지털타임스. 무단전재 및 재배포 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.