0008550644_001_20251020211709421.jpg?type=w800

US-EAST 리전 도메인주소해석 오류 원인지목…"대부분 정상화"
韓도 삼성월렛·퍼플렉·로블록스·캔바 등 다운…IT 대란 경고
GERMANY-INDUSTRY-TRADE-FAIR ⓒ AFP=뉴스1

(서울=뉴스1) 김민석 기자 = 아마존웹서비스(AWS)가 도메인 주소 해석 오류로 시작된 장애를 약 6시간 만에 수습했지만 그 사이 전 세계 수천여 개 서비스가 동시 마비되면서 클라우드 인프라의 취약성이 다시 한 번 드러났다.

AWS 장애에 미국 최대 암호화폐 거래소 코인베이스를 비롯해 퍼플렉시티·스냅챗·맥도날드·로블록스·포트나이트·클래시로얄 등 주요 IT·게임 플랫폼이 일제히 서비스 마비를 겪었다. 한국에서도 삼성월렛·배틀그라운드·퍼플렉시티·로블록스 등이 영향을 받았다.

20일 미국 북부 버지니아에 있는 AWS 최대 리전 US-EAST-1에서 한국시간 오후 4시쯤(태평양 시간 오전 12시)부터 다수의 오류가 발생했다.

AWS는 상태페이지를 통해 이날 오후 5시 26분(오전 1시 26분) DynamoDB(고성능 데이터베이스 서비스)의 엔드포인트 요청에서 심각한 오류율이 확인됐고 이 때문에 다른 AWS 서비스들에도 영향을 미치고 있다고 설명했다.​

AWS가 대규모 장애의 잠재적 원인으로 도메인이름시스템(DNS) 해석 오류를 지목하며 한국시간 오후 7시 35분(태평양시간 오전 3시 35분) 근본적인 DNS 문제를 완전히 완화해대부분의 AWS 서비스 작업이 정상적으로 작동하고 있다고 보고했다.(AWS 서버운영 상태페이지 갈무리)

AWS는 오후 6시 1분(오전 2시 1분) 이번 장애는 도메인네임시스템(DNS) 해석 오류에서 시작됐다며 잠재적 원인을 밝혔다. DNS는 웹사이트 주소를 컴퓨터가 인식할 수 있는 숫자 주소로 변환하는 일종의 '인터넷 주소록' 역할을 한다.

AWS는 조사 결과 DynamoDB 애플리케이션프로그래밍인터페이스(API) 엔드포인트에 대한 DNS 해석 과정에서 문제가 발생했다며 자사는 용량 부족 오류로 나타날 수 있는 오류를 전체적으로 복구하기 위해 노력하고 있다고 설명했다. 또 오후 9시까지(오전 5시)까지 추가 업데이트를 제공할 예정이라고 했다.

AWS는 이번 장애로 △아마존 DynamoDB △AWS IAM(자격증명관리) △AWS 사설인증기관 △AWS 시크릿 매니저 △AWS 보안토큰서비스 △AWS 지원센터 △아마존클라우드프론트 △아마존 엘라스틱 컴퓨팅 클라우드 △아마존 VPC 등 70개~80개 서비스가 영향을 받았다고 보고했다.

이번 장애는 데이터베이스·가상머신·컨테이너·네트워크 인증 등 다층 구조에 걸쳐 발생했다.​

IT 장애 추척(모니터링) 사이트 다운디텍터에 따르면 △AWS △퍼플렉시티 △스냅챗 △캔바 △듀오링고 △로블록스 △포트나이트 △맥도날드 앱 △코인베이스 등 수만 건의 장애 신고가 접수됐다. 스트리밍 서비스인 디즈니플러스·훌루·프라임 비디오도 영향을 받았다.​

AWS는 공식 사후 보고서(Post-Event Summary·PES)를 발표하지 않은 상태다.

퍼플렉시티 AWS US-EAST 리전 오류증가에 시스템 마비 및 정상화(퍼플렉시티 상태페이지 갈무리)

이날 아라빈드 스리니바스 퍼플렉시티 CEO는 X(옛 트위터)를 통해 "근본 원인은 AWS 장애에 있다"고 말했다. 퍼플렉시티는 상태페이지를 통해 한국시간 오후 6시 44분 "해당 사건이 이제 해결됐다"고 공지했다.

한국 서비스 중에선 삼성월렛이 "AWS 서버 장애로 서비스 이용이 간헐적으로 원활하지 않다"고 공지했다. 카카오게임즈가 서비스하는 크래프톤 배틀그라운드 한국 서비스도 일시적으로 중단됐다. 로블록스 이용자들도 장애 현상을 겪었다.

서비스들은 현재 대부분 정상화됐다. 다만 SK텔레콤·삼성전자·현대차·넥슨 등도 AWS 인프라를 활용하고 있어 대규모 장애 발생 시 국내 산업 전반에 충격을 줄 수 있다는 지적이 나온다.

업계 관계자는 "AWS는 글로벌 클라우드 시장 점유율 30%를 차지하는 핵심 사업자"라며 "이번 장애가 발생한 US-EAST-1(버지니아 북부) 리전이 핵심인 만큼 안정성 확보가 필수"라고 말했다.

<용어설명>

■ API
API는 응용프로그램 인터페이스(Application Programming Interface)로 하나의 소프트웨어 컴포넌트가 다른 소프트웨어 컴포넌트와 상호작용할 수 있도록 설계된 인터페이스다. 즉, 소프트웨어끼리 서로 정보를 주고받고 기능을 사용하게 해주는 중간다리다.

■ DNS
DNS(Domain Name System·도메인 네임 시스템)는 인터넷의 주소록 역할을 하는 핵심 인프라다. 이용자가 기억하기 쉬운 문자 형태의 도메인을 입력하면 DNS는 이를 컴퓨터가 이해할 수 있는 숫자 형태의 IP 주소로 변환한다.

■ IAM
IAM(Identity and Access Management·신원 및 접근 관리)는 클라우드 플랫폼의 다양한 구성원(사용자·서비스·그룹 등)이 클라우드 리소스에 접근할 수 있는 권한을 체계적으로 관리하는 핵심 보안 서비스다.