김용대 KAIST 교수팀 연구
AI 댓글의 고유한 패턴 찾아내
내용·문법 정확해도 너무 형식적
댓글 통한 여론조작 차단 가능
[매경DB]
생성형 인공지능(AI) 기술이 발전하면서 여론 조작의 위험성도 그만큼 커지고 있다. 생성형 AI를 이용하면 몇 시간 만에 댓글 수십만 개를 자동 생성할 수 있는데, 마치 그게 여론인 것처럼 보일 수 있기 때문이다.
김용대 KAIST 전기및전자공학부 교수 연구팀이 국가보안기술연구소와 함께 한국어 AI 생성 댓글을 탐지하는 기술을 세계 최초로 개발했다. 이를 이용하면 앞으로 AI가 쓴 댓글을 구분할 수 있고, 부적절한 여론 조작 시도를 잡아낼 수 있다.
댓글이 많은 뉴스를 골라서 읽는 한국인 온라인 뉴스 이용자. [사진 = 챗GPT]
온라인 뉴스 댓글은 여론에 많은 영향을 미친다. 2021년 한국리서치 조사에 따르면, 온라인 뉴스 사용자의 42%가 댓글이 많은 뉴스를 골라서 읽으며 55%는 댓글이 사람의 생각에 영향을 준다고 여겼다.
생성형 AI 등장으로 여론 조작의 문턱이 낮아졌다. 생성형 AI를 이용해 뉴스 포털에 수십만 개 댓글을 다는 데는 몇 시간이면 충분하다. 챗GPT-4o를 기준으로 비용도 댓글 1개당 1원 정도밖에 들지 않는다.
AI가 생성한 댓글을 탐지하고 식별하는 모습. 이 댓글은 구글 제미나이가 생성한 것으로, 띄어쓰기가 규칙적이고 일반적인 이모지를 사용하고 있다. [사진 = KAIST]
국내 최대 뉴스 플랫폼인 네이버의 하루 평균 댓글 수가 20만개가량인데, 단 20만원이면 전체 댓글을 만들어낼 수 있는 것이다.
그러나 지금까지 AI가 작성한 댓글과 사람이 작성한 댓글을 구분하는 일은 사람에게도 매우 어렵다. 연구진이 사람에게 총 210개의 댓글을 평가하게 하자, AI가 쓴 댓글의 67%를 사람이 작성한 것으로 착각했다.
한국어 댓글에는 ‘ㅋㅋㅋㅋ’ ‘ㅠㅠㅠㅠ’처럼 짧은 구어체가 많아 AI로 분석하기도 어렵다. 연구진은 14종의 다양한 대규모언어모델(LLM)을 활용해 AI 댓글 모음을 구축하고, AI가 생성한 댓글의 고유한 패턴을 찾아냈다.
[사진 = 챗GPT]
연구에 따르면 AI와 사람의 댓글 차이는 결국 ‘감정’이었다. AI는 ‘것 같다’ ‘에 대해’ 등 형식적인 표현을 자주 사용하는 반면, 사람은 ‘ㅋㅋㅋㅋ’ 같은 반복 문자나 감정 표현을 즐겨 사용했다. ‘ㅋㅋㅋㅋ’ ‘ㅠㅠㅠㅠ’ 같은 반복 문자 사용 비율은 사람은 52%였으나, AI는 12%에 그쳤다.
또한 사람은 자신의 생각이나 감정을 직접 표현하는 말투를 자주 사용했고 사회나 공동체에서 통하는 밈, 유행어를 자주 썼다.
실험 결과 이번 기술은 기존 기술보다 68% 더 정확하게 AI 생성 댓글을 구별해냈고, 각 LLM이 가진 고유 말투까지 파악해 어떤 LLM이 댓글을 썼는지도 정확하게 찾아냈다.
김용대 KAIST 전기및전자공학부 교수. [사진 = KAIST]
이번 연구는 향후 댓글을 이용한 여론 조작 시도를 차단하는 데 크게 도움이 될 전망이다. 연구진은 “CCTV가 범죄 시도 자체를 줄이는 것처럼 정확한 AI 탐지 기술의 존재만으로도 온라인 여론 조작 시도를 억제하는 심리적 장치로 작용할 수 있을 것”이라고 했다.
어떤 LLM이 썼는지도 알 수 있기 때문에 대규모 조작 활동이 일어날 경우 실시간 모니터링도 할 수 있다. 의심스러운 계정을 선제 차단하는 조치도 가능하다.
연구를 이끈 김 교수는 “여론 조작 방어의 첫 단계는 AI가 작성했는지를 파악하는 것”이라며 “포털에 실제로 적용해 여론 조작 우려가 사라지기를 바란다”고 했다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
매주 일요일 밤 0시에 랭킹을 초기화합니다.