ADVERTISEMENT

[팩플] “카카오톡 복구 왜 이렇게 느려?”…카카오 이중화, 진실은

중앙일보

입력

업데이트

15일 오후 경기 성남시 분당구 삼평동 SK판교캠퍼스에서 화재가 발생해 관계자들이 복구작업을 위해 현장으로 들어서고 있다. 이날 오후 카카오 등 데이터 관리 시설이 입주해있는 이 건물 지하에서 불이나면서 카카오톡, 카카오택시 등 일부서비스에 장애가 빚어지고 있다. 뉴스1

15일 오후 경기 성남시 분당구 삼평동 SK판교캠퍼스에서 화재가 발생해 관계자들이 복구작업을 위해 현장으로 들어서고 있다. 이날 오후 카카오 등 데이터 관리 시설이 입주해있는 이 건물 지하에서 불이나면서 카카오톡, 카카오택시 등 일부서비스에 장애가 빚어지고 있다. 뉴스1

국민메신저로 불리는 카카오톡(이하 카톡)이 16일에도 완전 복구되지 않고 있다. 4750만명이 이틀째 불편을 겪고 있는 것. 카톡 계정과 연결된 카카오T, 카카오내비, 카카오페이 등도 여전히 일부 기능이 원활하지 않다. 카카오는 “서비스 장애에 대비해 이원화 조치도 마련했었다”는데, 대체 왜 이렇게 더딘가. 카톡 기반 서비스들, 앞으로 믿고 쓸 수 있을까.

무슨일이야

15일 오후 3시 19분 SK C&C 판교데이터센터에서 발생한 화제로 카카오의 서비스 장애가 계속 이어지고 있다. 16일 오전 2시부터 데이터센터 전원이 공급되면서 카톡의 일부 기능을 비롯해 서비스들이 복구 되고 있지만, 속도가 더디다. 서비스 오류 이틀째인 이날 오후 12시 양현서 카카오 부사장은 판교 SK C&C에서 열린 미디어 브리핑에서 “여기에 있는 3만 2000대의 서버 중 1만 2000대가 복구됐다”며 “이중화 조치를 했음에도 불구하고 전원 공급이 차단된 상황이어서 서버를 증설해 트래픽을 전환하는 데 시간이 많이 걸리고 있다”고 말했다.

카카오의 이중화, 진실은

① “이중화 했다” vs “그건 이중화 아니다”
◦ 카카오가 했다는 이중화? : 카카오는 줄곧 “시스템은 이중화 돼있고, 즉시 조치를 시작했다”고 해명했다. 데이터는 총 4개의 데이터센터에 분산 저장돼있고, 시스템도 이중화 돼 있기 때문에 데이터 손실 위험은 ‘제로’(0) 라는 것. 양 부사장은 “화재 때문에 직접 진입해서 시스템을 수리하거나 장애를 개선할 수 있는 부분에 물리적 한계가 있었다”고 말했다. 즉 이중화를 하긴 했지만, 판교 데이터센터에 접근이 차단돼 이중화 속도가 더뎠다는 설명. 그러나 업계에선 “그건 이중화가 아니다”고 지적한다.

◦ “사실상 이중화 안 한 것” : 정보기술(IT) 업계에선 카카오가 판교 한 곳에만  메인 시스템을 몰아 놓고, 이중화를 부분적으로만 해 사실상 안한 것이나 마찬가지라는 의구심이 나오고 있다. 메인 시스템을 여러 데이터센터에 고르게 구축하지 않아 판교에서 장애가 발생했을 때 속수무책일 수 밖에 없었다는 추정이다. 과기정통부 관계자는 “이중화에 대한 기술 기준이 없기 때문에 이중화 여부를 무 자르듯 구분하긴 어렵지만 카카오의 경우 통상적 의미에서 이중화가 됐다고 보긴 어렵다”고 말했다.

카카오와 네이버의 대응 차이를 가른 것도 결국 이중화였다. 사고가 발생한 판교 데이터센터에 네이버도 적지 않은 서버를 두고 있으나 카카오 수준으로 서비스 먹통 상태까지 가지 않았다. 네이버 관계자는 “주요 서비스 이중화를 통해 IDC 장애 등에 꾸준히 대비하고 있기 때문에 재해 발생에도 영향이 적었다”고 말했다. 김승주 고려대 정보보호대학원 교수는 “이중화를 했느냐 안했느냐의 문제가 아니라 어느 정도로 했는지가 중요하다”며 “예를 들어 컴퓨터 하드에 100개의 파일이 있는데 외장하드에는 주요 파일 5개만 넣어 놓으면 이중화율은 5%에 불과해, 사실상 이중화 조치는 안 된 것으로 봐야 한다”고 지적했다.

② 카카오 재해복구 시스템, 작동했나

카카오의 비상 재해복구(Disaster RecoveryㆍDR) 시스템이 제대로 작동하지 않았다는 비판도 나온다. DR은 데이터 보유 정도에 따라 ‘미러사이트’, ‘핫사이트’, ‘웜사이트’, ‘콜드사이트’로 나뉜다. 원본을 그대로 복제하는 미러사이트는 주 사이트(카카오의 경우 판교 데이터센터)와 동일한 시스템을 하나 더 설치해 운영하는 것이고, 핫사이트는 미러사이트까지는 아니어도 주 사이트에 버금가는 설비와 자원을 구축한 곳이다. 핫사이트만 구축했어도 대개 수시간 내에 주 사이트를 복구할 수 있다. 보안 업계 관계자는 “과거의 여러 사고로 DR과 데이터 이원화는 필수라는 인식이 생겼는데, 문제는 비용”이라며 “카카오의 경우 다른 데이터센터에 판교를 보충할만한 리소스를 제대로 배치하지 않은 것 같다”고 말했다.

피해 보상은?

15일 발생한 카카오 관련 서비스 장애로 '카카오톡 로그인'을 사용 중인 다른 서비스들도 로그인 등 이용에 차질을 빚었다. 왼쪽은 캐치테이블, 오른쪽은 런드리고. [사진 각 서비스 캡쳐]

15일 발생한 카카오 관련 서비스 장애로 '카카오톡 로그인'을 사용 중인 다른 서비스들도 로그인 등 이용에 차질을 빚었다. 왼쪽은 캐치테이블, 오른쪽은 런드리고. [사진 각 서비스 캡쳐]

카카오는 일단 유료 서비스에 대해 피해 보상책을 마련하겠다는 입장이다. 카카오 유료서비스 이용 약관에 따르면 ‘정전, 정보통신설비의 장애 또는 고장, 이용량 폭주나 통신두절 등으로 정상적인 서비스 제공에 지장이 있는 경우’(제 12조 1항 2호) 카카오가 보상해야한다. 일단 서비스 장애가 발생한 카카오엔터테인먼트의 음악 플랫폼 ‘멜론’과 웹툰 서비스 ‘카카오웹툰’은 이날 보상책을 발표했다. 멜론은 이용권을 보유한 고객 모두의 이용권 사용 기간을 3일간 연장하고, 카카오웹툰은 서비스 장애 기간 내 대여 중인 웹툰 회차 및 만료된 회차의 열람 기한을 72시간 연장하기로 했다.

카카오 관계자는 “나머지 서비스에 대해서도 복구가 진행되는 대로 피해보상 절차나 내용 등을 순차적으로 공지할 예정”이라고 말했다. 이날 사고 현장을 찾은 국회 과학기술정보통신위원회의 질의에서 홍은택 카카오 각자대표는 “피해 규모와 법인을 조사해 보상 계획을 마련하려고 준비를 하고 있다”며 “피해가 잘 만회될 수 있도록 충분히 보상 계획을 수립하겠다”고 밝혔다. 카카오모빌리티가 운영하는 카카오T의 경우, 이번 사고로 택시 호출을 못 받아 생업에 지장을 받은 기사 보상안과 관련해 “추후 입장을 정리해 밝히겠다”고 말했다. 전날 온라인 커뮤니티에서는 한 이용자가 “카카오 킥보드 이용 후 반납이 안 돼 요금이 10만원을 넘어섰다”고 해 논란이 되기도 했다. 카카오T 관계자는 “실제 주행 거리나 시간에 대해서만 과금 하겠다”고 말했다.

앞으로는

카카오톡, 카카오T 등 주요 서비스 먹통 사태가 장기화된 틈을 타 라인(메신저), 우티ㆍ타다(교통) 등의 다운로드 건수가 증가한 것으로 나타났다. 애플 앱스토어에 따르면 전날 오후 무료앱 인기차트 7위였던 라인은 이날 오전 1위를 차지했다.

카카오 대란