(33) 인공지능은 '인공'일까
편집자주
실패를 살펴보는 것은 성공으로 가는 지름길입니다. 'AI오답노트'는 AI와 관련한 제품과 서비스, 기업, 인물의 실패 사례를 탐구합니다.
흐르는 개울물을 로봇의 양손이 퍼담는 모습. 게티이미지뱅크
인공지능(AI)이라는 단어를 들으면 어떤 이미지가 떠오르시나요?
대체로 차갑고 건조한 금속의 질감, 자로 잰 듯한 직선적인 로봇의 움직임이 연상되실 겁니다. '인공적'이라는 단어는 무언가 자연적인 것과는 대비되는 느낌을 주죠. 반면 '인간적'이라는 말은 따뜻함, 감성적, 말랑말랑한 느낌이 듭니다.
이런 대비는 보편적인 인상이라 할 수 있을 겁니다. 인공지능은 딱딱한 컴퓨터 코드와 차가운 알고리즘의 세계에 속하고, 인간은 따뜻한 감정과 직관의 영역에 존재한다고 여기는 것이죠. 실제로도 그러할까요. 인공지능은 정말로 '인공적'이기만 할까요.
챗GPT, 클로드(Claude) 등 각종 AI 서비스들은 디지털화된 모든 텍스트, 이미지, 동영상을 학습하며 인간의 지식, 경험, 심지어 감정적 뉘앙스까지 흡수하고 있습니다. 그러나 이러한 학습은 순수하게 기계적인 과정이 아닙니다.
지구를 착취하다: 인공지능과 천연자원 소비
1992년 1월, 중국의 개혁·개방을 진두지휘하던 덩샤오핑은 네이멍구 자치구 바오터우(包頭) 지역을 방문해 "중동에 석유가 있다면, 중국에는 희토류가 있다"고 말했다. 사진은 중국 네이멍구에 있는 희토류 광산. 로이터연합뉴스
AI의 혈관에는 전기가 흐릅니다. AI를 구성하는 하드웨어와 소프트웨어는 전력으로 연산하고 움직이죠. 이 AI 시스템은 문자 그대로 엄청난 전력을 소비합니다.
국제에너지기구(IEA_에 따르면 전세계 데이터센터 전력 사용량은 2022년 기준 460TWh에서 2026년에는 1050TWh로 2배 이상 증가할 것으로 전망됐습니다. 삼일PwC경영연구원은 'AI는 전기를 먹고 자란다'는 제목의 보고서마저 냈습니다.
데이터센터는 흔히 클라우드(Cloud)와 짝지어 생각되곤 합니다. 클라우드는 컴퓨팅 자원을 인터넷을 통해 필요할 때마다 빌려쓰는 서비스입니다. 클라우드는 데이터센터를 통해 작동되는 것이라 볼 수 있죠. 클라우드는 '구름'이라는 뜻을 갖고 있습니다. 청정하고 친환경적인 이미지를 주죠. 그러나 꼭 그렇지만은 않습니다.
데이터센터는 세계 최대의 전기 소비처 중 하나입니다. 데이터센터는 열을 발생시키기 때문에, 이를 식히기 위한 물까지 필요로 합니다. 냉각을 위한 막대한 물 소비량은 지역 수자원 부족 현상마저 초래하죠. 중국의 데이터센터산업은 동력의 73%를 석탄에서 얻었으며, 2018년에만 9900만톤의 이산화탄소를 배출했습니다.
AI 시스템을 운용하기 위한 하드웨어(CPU·GPU 등)를 만들기 위해서는 희토류 광물이 필수적입니다. 문제는 희토류의 채굴과 정제, 가공 과정이 매우 까다롭고 심각한 환경오염을 발생시킨다는 점입니다.
미국 지질조사국(USGS)에 따르면, 중국은 전세계 희토류 공급의 70% 이상을 차지하고 있습니다. 희토류가 중국에만 있기 때문일까요? 아니면 중국만이 채굴 기술력이 있어서 일까요?
매장된 희토류를 쓸만하게 만들려면 대량의 황산과 질산을 녹이는 위험한 공정을 거쳐야 합니다. 자연은 물론, 인간 노동자의 목숨마저 담보로 하죠. 중국이 희토류 공급을 독점할 수 있는 건, 바로 이러한 비용을 감당하겠다는 국가가 중국밖에 없기 때문입니다. 즉, 희토류 채굴은 인건비가 저렴하고 환경 규제가 느슨한 곳이 경쟁력을 갖습니다.
노동 착취 : 인간을 연료로 쓰는 자동화
대규모 이미지 데이터베이스 이미지넷. 이러한 각각의 이미지가 무엇을 담고 있는지 정의하고, 분류를 하는 작업은 사람이 해야 한다. 오늘날 딥러닝 모델이 발전하는데 이미지넷은 지대한 공헌을 했다. 이미지넷
AI가 지구의 자원을 얼마나 많이 소비하는지, 환경에 얼마나 부정적인 영향을 미치는지는 상대적으로 언론 보도도 많고, 잘 알려진 편입니다.
AI 시스템을 만들고 유지하기 위해서는 천연자원뿐만 아니라, 무수히 많은 저임금 노동력이 필요합니다. 'AI를 위한 노동 착취'는 환경 착취에 비해 조명을 덜 받은 감이 있습니다.
AI는 데이터를 학습해야 하고, 학습한 데이터의 가치에 따라 AI의 가치도 결정됩니다. AI가 학습하는 데이터 중에서 아주 핵심적인 데이터 뭉치 중 하나가 바로 '이미지넷(ImageNet)'입니다.
AI가 '사과' 이미지를 보고 사과라고 판정할 수 있으려면, 일단 무수히 많은 사과 이미지를 학습해야 합니다. 즉, AI 이미지 학습을 위해서는 수천·수억장의 사진이 필요하고, 그 사진들을 분류하고, 라벨을 붙이는 사전 작업이 필요하죠. 이미지넷은 바로 그걸 가능케 한 이미지 데이터베이스 입니다.
이 작업 뒤에는 무수히 많은 저임금 노동자들이 있었습니다. 개발도상국의 IT 인력들이, 턱없이 낮은 임금을 받으며, 사진의 제목은 뭔지, 사진 속에 있는 것은 무엇인지를 하나하나 표시한 것이죠.
AI를 떠받치는 현대판 노예제
수많은 저임금 노동자들이 모니터 앞에서 이미지 분류 작업을 하는 광경을 AI가 묘사한 이미지. DALL-E3
이미지넷 프로젝트는 '아마존 메커니컬 터크(Amazon Mechanical Turk)'를 통해 이뤄졌습니다. 메커니컬 터크는 크라우드소싱 플랫폼인데, 간단히 말해 저임금 노동을 사고파는 서비스입니다. 데이터 분류, 편집, 라벨링 작업이 필요한 사람과, 거기에 노동을 제공할 사람을 연결해주는 서비스죠.
세계 167개국에서 5만명 가까운 작업자가 이미지넷 프로젝트에는 동원됐다고 합니다. 이들은 약 10억 장의 이미지 정리 분류 작업을 했죠. 우리가 AI의 똑똑함이라고 여기는 것은, 사실 이처럼 많은 사람의 반복 노동에 기반한 결과인 겁니다.
이미지와 데이터를 분류하고, 라벨을 다는 작업을 단순하다고 생각하기 쉽습니다. 그러나 이들이 개와 고양이 사진만 가려내는 게 아닙니다. 폭력, 고문, 아동학대, 참사 현장, 동물의 사체, 피와 오물 등 각종 데이터를 직접 봐야만 합니다. 매일 장시간 그런 정보에 노출된 노동자들은 일상생활이 불가능할 정도의 정신적 충격을 받았습니다.
케냐의 데이터 노동자들은 하루 8시간 넘게 잔인하고 끔찍한 이미지와 텍스트를 하나하나 검토해야 했는데, 이들이 받은 임금은 원화로 1600~2400원 수준이었습니다.
캘리포니아대 교수 릴리 이라니(Lilly Irani)는 디지털 기술과 AI 시스템을 "인간을 연료로 쓰는 자동화"라고까지 묘사합니다.
케냐의 AI 데이터 노동자들은 2023년 조 바이든 미국 대통령에게 보낸 공개서한에서는 "미국 빅테크들이 체계적으로 아프리카 노동자들을 착취하고 있으며 현지 노동법을 무시하고 있다"고 주장했습니다. 그들은 자신들의 근로상황을 묘사하며 '현대판 노예제'라 비유했습니다.
"우리는 하루 8시간 이상 살인과 참수, 아동 학대와 강간, 포르노와 수간을 지켜봐야 한다. 시간당 2달러도 안 되는 임금을 받고 이 일을 하고 있다."
지구와 인간을 위한, 지속가능한 AI
지구와 환경을 생각하는 발전을 묘사한 이미지. 게티이미지뱅크
'AI의 혈관에는 전기가 흐른다'는 말은 참입니다. 그리고 AI의 혈관에는 인간의 피와 땀과 눈물이 흐른다는 말도 참입니다.
우리가 매일 이용하는 AI 인프라에는 인간의 노동과 지구의 자원이 깊이 스며들어 있습니다.
AI를 지속적으로 발전시켜나가되, 환경적 영향을 최소화하는 노력이 필요합니다. 데이터센터 운영 등에는 최대한 재생에너지를 활용하고, 전력 효율이 높은 인프라를 우선해야 합니다.
AI 개발에 참여하는 노동자들에게는 공정한 보상을 하고, 안전한 노동환경을 제공해야 합니다. 마이크로소프트 연구원 출신 메리 그레이와 시드 서리는 책 '고스트 워크(Ghost Work)'에서 "감춰진 노동을 어둠 밖으로 끌어내야 한다"고 강조합니다. 트라우마를 유발할 수 있는 콘텐츠 처리 작업자에겐 심리적 지원도 필요합니다.
인공지능은 이제 더 이상 '인공적'이라는 단어 뒤에 숨을 수 없습니다. AI는 일부 빅테크의 전유물이 아니며, 지구와 인간의 노동력이 만들어낸 결과물입니다.
AI를 피할 수 없는 현실이라 받아들인다면, 이러한 불편한 진실도 마주해야만 합니다. 이를 통해 보다 공정하고 지속가능하고 AI를 만들어갈 수 있을 것입니다.
김동표 기자 letmein@asiae.co.kr
Copyright © 아시아경제. 무단전재 및 재배포 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.