KAIST, 한국어 AI 생성 댓글 탐지기술 개발
AI 댓글, 사람 다른 패턴..98.5% 정확도 탐지
KAIST가 개발한 한국어 AI 댓글 생성 프레임워크(XDAC)의 데모 탐지 및 식별 시연 예시도. KAIST 제공
KAIST는 한국어 AI 생성 댓글을 탐지하고, 댓글을 생성한 AI 모델까지 식별하는 AI 댓글 생성 프레임워크(XDAC)를 개발했다. KAIST 제공
생성형 인공지능(AI)이 한국어로 작성한 댓글을 높은 정확도로 탐지하면서 댓글 생성 AI 모델까지 식별하는 탐지하는 기술이 개발됐다. 앞으로 AI 기반 여론 조작 대응을 위한 기술적 기반으로 활용될 것으로 기대된다.
KAIST는 김용대 전기및전자공학부 교수 연구팀이 국가보안기술연구소와 공동으로 한국어 AI 생성 댓글을 탐지하는 'XDAC'를 개발했다고 23일 밝혔다.
최근 생성형 AI는 뉴스 기사 맥락에 따라 감정과 논조까지 조절하며 몇 시간 만에 수십 만개의 댓글을 자동 생성할 수 있다. 이 때문에 이를 악용한 온라인 여론 조작 우려가 커지고 있다. 오픈AI의 GPT-4o의 경우 댓글 1개 생성 비용이 약 1원으로, 국내 주요 뉴스 플랫폼의 하루 평균 댓글 수인 20만 개를 생성하는 데, 단 20만원이면 가능하다.
그동안 AI 생성글 탐지 기술은 대부분 영어로 된 장문의 정형화된 글을 기반으로 개발돼 한국어의 짧은 댓글에는 적용이 어려웠다. 또한 한국어 AI 생성 댓글 데이터셋이 부족하고, 기존의 단순한 프롬프트 방식으로는 다양하고 실제적인 댓글 생성에 한계가 있었다.
연구팀은 △14종의 LLM 활용 △자연스러움 강화 △세밀한 감정 제어 △참조자료를 통한 증강 생성 등 네 가지 전략을 적용한 AI 댓글 생성 프레임워크를 개발하고, AI 생성 댓글에 사람과 다른 고유한 말투 패턴이 있음을 확인했다.
가령, AI 생성 댓글은 "∼것 같다", "∼에 대해" 등 형식적 표현과 접속어 사용이 많았고, 사람 생성 댓글은 반복 문자, 감정 표현, 줄바꿈, 특수기호 등 자유로운 구어체 표현이 상대적으로 빈번하게 쓰였다. 특수문자 사용에서도 AI는 표준화된 이모지를 주로 사용한 반면 사람은 한국어 자음(ㅋ, ㅠ, ㅜ 등)이나 특수 기호(★·● 등) 등 문화적 특수성이 담긴 다양한 문자를 썼다.
연구팀은 이런 차이를 정교하게 반영해 탐지 성능을 높이고, 각 LLM의 고유 말투 특징을 파악해 어떤 AI 모델이 댓글을 생성했는지도 식별할 수 있도록 XDAC를 설계했다. 그 결과, XDAC는 AI생성 댓글 탐지 정확도가 기존 68%에서 98.5%로 향상됐고, 댓글 생성 LLM 식별에서도 84.3%의 정확도를 기록했다.
XDAC는 탐지뿐 아니라 심리적 억제 장치로 작용해 AI 악용 시도를 줄일 수 있었다고 연구팀은 설명했다.
고우영 KAIST 선임연구원은 "XDAC는 생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고, 생성모델까지 식별할 수 있다"며 "의심스러운 계정이나 조직적 여론 조작 시도를 정밀 감시·대응하는 데 활용할 수 있으며, 실시간 감시 시스템이나 자동 대응 알고리즘으로 확장 적용할 수 있을 것"이라고 말했다.
이 연구결과는 AI 자연어 처리 분야 국제 학술대회인 'ACL 2025'에서 설명가능한 AI 기반 탐지 프레임워크로 채택됐다.이준기기자 bongchu@dt.co.kr
Copyright © 디지털타임스. 무단전재 및 재배포 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.