합성 데이터와 실제 데이터 비교해
자주 사용되는 패턴 등 파악 가능해져
AI 경쟁서 뒤처진 위기감 반영한 조치
애플 로고.
인공지능(AI) 경쟁에서 뒤처지고 있다는 평가를 받는 애플이 AI 성능 개선을 위해 아이폰 등 고객들이 사용하는 기기 속의 데이터를 분석하는 새로운 훈련 방식을 도입한다. 그동안 개인정보 사용을 철저히 차단한 채 합성 데이터만으로 AI를 학습시켜 온 방침을 수정한 것이다. 사용자의 실제 데이터를 분석 대상으로 삼는 만큼 개인정보 침해 논란을 피하기 어려울 전망이다.
15일(현지시간) 블룸버그 애플 전문 기자 마크 거먼의 보도에 따르면 애플은 최근 ‘차등 개인정보 보호를 활용한 애플 인텔리전스의 집계 추세 이해’라는 제목의 기술 문서를 공개하고, 사용자 데이터와 합성 데이터를 결합해 애플 인텔리전스의 기반이 되는 모델을 훈련시키는 새로운 계획을 밝혔다.
지금까지 애플은 합성 데이터만으로 AI를 학습시켜왔다. 이는 개인정보 노출 가능성이 없지만, 실제 고객의 사용 패턴을 정확히 반영하지 못해 트렌드 파악이나 자연스러운 맥락 이해에 한계를 드러냈다.
애플이 새롭게 도입하려는 방식은 실제 사용자 데이터에 기반한 합성 데이터를 생성하는 것이다. 아이폰, 아이패드, 맥 등 애플 기기의 이메일에서 수집된 실제 사용자 샘플을 기존 합성 데이터와 비교해 유사도를 평가한다. 이를 통해 사람들이 자주 사용하는 표현이나 메시지 패턴을 보다 정확히 파악해 AI가 더욱 현실을 잘 반영하는 결과를 도출할 수 있도록 하겠다는 게 애플의 목표다.
애플은 모든 데이터 수집에는 데이터에 의도적인 노이즈를 추가해 개별 사용자 식별이 불가능하도록 만드는 ‘차등 개인정보 보호’ 기술이 적용된다고 밝히며 개인정보 침해 논란을 일축했다. 또한 수집된 데이터는 기기 외부로 유출되지 않으며, 사용자 동의 없이는 작동하지 않아 안전하다고 강조했다. 아이폰, 아이패드 또는 맥북 등 기기를 초기 설정할 때 애플의 데이터 분석 기능에 동의하지 않으면 AI 훈련 시스템은 활성화되지 않는다는 설명이다.
하지만 간접적으로라도 실제 이메일 등 민감한 개인 데이터가 AI가 학습에 활용되는 만큼, 이러한 조치만으로는 논란을 완전히 잠재우기는 어려울 것으로 보인다.
AI 학습에 순수 합성 데이터를 사용하던 애플이 개인정보 침해 논란을 무릅쓰고 사용자 데이터 사용에 나선 것은 AI 경쟁에서 뒤처지고 있다는 위기감 때문이다. 최근 애플 인텔리전스를 기반으로 한 AI 비서 ‘시리(Siri)’의 핵심 기능 출시가 지연되는 등 애플은 이미 업계에서 ‘AI 지각생’이라는 낙인이 찍힌 상태다. 최근에는 시리 관련 사업 부서의 경영진을 대거 교체하며 내부 재정비 움직임도 이어지고 있다. 애플은 iOS 18.5, 맥OS 15.5 베타 버전에 해당 AI 훈련 시스템을 먼저 적용할 계획이다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
매주 일요일 밤 0시에 랭킹을 초기화합니다.