오픈AI 전 제품군 중단…수백만 사용자 업무·학습 차질
[이데일리 김현아 기자] 생성형 AI의 대표주자인 오픈AI(OpenAI)의 핵심 서비스들이 6월 10일(현지시간) 전 세계적으로 10~16시간 가까이 중단되는 초유의 사태가 발생했다.
장애는 미국 동부시간 기준 오전 2시 45분(한국시간 오후 3시 45분)부터 시작됐으며, 인도, 미국, 영국, 호주, 한국 등지의 사용자 수백만 명이 서비스 불능 또는 오류를 겪었다. 특히 기업용 고객과 교육·연구기관까지 포함된 피해 범위는 광범위했다.
소라부터 API까지 마비
문제는 일시적인 접속 지연이 아니었다. 텍스트 생성 플랫폼 ‘챗GPT(ChatGPT)’를 포함해, 영상 생성 도구 ‘소라(Sora)’, 기업용 응용프로그램인터페이스(API)까지 주요 서비스 전반에서 장애가 동시다발적으로 발생했다.
장애 발생 시점부터 사용자들은 “Too many concurrent requests”, “Network error occurred” 등 오류 메시지를 반복적으로 접해야 했으며, 일부는 웹과 앱 모두 접속 자체가 차단되기도 했다. 응답 지연과 오류율 증가 등 성능 저하도 함께 나타나며 실질적 업무와 학습 활동에 큰 차질을 야기했다.
‘데이 롱 아웃티지’…최대 16시간 이어진 복구 지연
장애는 몇 시간 내 해결될 수 있는 간단한 이슈가 아니었다. 더버지(The Verge), 테크크런치(TechCrunch) 등 주요 외신들은 “daylong outage(하루 종일 지속된 장애)”라는 표현까지 써가며 복구 지연의 심각성을 전했다.
실제 복수 사용자들은 미국 기준 오전 11시(한국 자정) 이후까지도 정상 이용이 어려웠다고 보고했다. 일부 서비스는 늦은 오후까지 지연된 후에야 완전히 정상화됐다. 인도·미국을 중심으로 SNS상에는 불만과 우려가 빠르게 확산됐다.
원인은 공개했으나, 설명은 없었다
오픈AI는 공식 시스템 상태 페이지를 통해 “높은 오류율과 응답 지연”을 언급하며 “루트 원인 식별 및 완화(mitigation) 작업 중”이라고 공지했지만, 정작 문제의 기술적 원인에 대한 구체적 설명은 끝내 제공하지 않았다.
서버 문제인지, 코드 결함인지, 혹은 내부 배포 시스템의 오류인지 등 핵심 정보는 공개되지 않아, 투명성 부족에 대한 비판이 제기되고 있다.
업계 관계자들은 “생성형 AI의 상업화가 급격히 확산되고 있는 가운데, 기술 인프라에 대한 신뢰는 선택이 아니라 필수”라며 “이처럼 장시간 서비스 중단이 발생하고도 원인조차 명확히 공개되지 않는다면, 오픈AI의 기술 의존도 자체에 대한 재평가가 필요하다”고 지적했다.
특히 API 기반으로 서비스를 운영하는 기업과 교육기관 입장에서는 사전 경고 없이 발생한 장시간의 서비스 불능 상태는 치명적이다. 일각에서는 이번 사태를 계기로 오픈AI가 제시해온 SLA(서비스 수준 협약)의 실효성에 의문이 제기될 수 있다는 분석도 나온다.
김현아 (chaos@edaily.co.kr)
Copyright © 이데일리. 무단전재 및 재배포 금지.
매주 일요일 밤 0시에 랭킹을 초기화합니다.