고개 숙인 카카오 “대비 부족했다…완전복구 언제 될지 몰라” (일문일답)

중앙일보

입력

업데이트

사상 초유의 ‘카카오 전방위 마비’에 카카오가 고개를 숙였다. 양현서 카카오 부사장은 16일 카카오 서버가 대량 입주해있는 경기도 판교 SK C&C 데이터센터(IDC) 화재 현장에서 기자들과 만나 “화재로 (카카오의) 서버 전체가  내려가는 것은 저희의 대비가 부족했다”고 시인했다. 그러나 “(메인 데이터센터의) 서버 3만 2000대가 전체 다운되는 것은 정보기술(IT) 역사상 유례 없는 사안이라 대처에 어려운 점이 있었다”고 덧붙였다.

이종호 과학기술정보통신부 장관이 16일 오전 경기 성남시 분당구 SK C&C 판교캠퍼스 카카오 데이터센터 화재현장을 방문하고 있다. 뉴스1

이종호 과학기술정보통신부 장관이 16일 오전 경기 성남시 분당구 SK C&C 판교캠퍼스 카카오 데이터센터 화재현장을 방문하고 있다. 뉴스1

복구 시점 미정…화재 원인 조사중

이날 현장 브리핑에 따르면, 카카오톡·카카오지하철·카카오내비 등 카카오 서비스들의 완전 복구 시점은 알 수 없다. 양 부사장은 “현재 3만 2000대 중 1만 2000대 가량 복구된 상황”이라며 “이중화 조치(데이터 등 IT 자원을 다른 곳에 복제해두는 것)가 되어 있음에도 불구하고 서버를 증설하여 트래픽을 전환하는 데 많은 시간이 걸리고 있다. 오후에 전원 공급이 되면 추가적으로 서버 대기가 가능할 것으로 예상된다”고 밝혔다. 이어 “현재 최선을 다하고 있지만 복구 시간이 언제가 될지는 확실하게 말씀드릴 수 없는 점 양해 부탁드린다”고 말했다.

화재 원인도 밝혀지지 않았다. 김완종 SK C&C 클라우드 부문장은 “정확한 화재 원인에 대해서는 소방당국과 국립과학수사연구원이 조사할 예정”이라며 “3일간 포렌식 등 정밀 조사를 통해 화재 원인을 식별하고 원인에 따라 재발 방지 대책을 철저하게 수립하겠다”고 말했다.

카카오와 SK C&C, 네이버클라우드 등 15일 화재 관련 기업들은 이날 오전 이종호 과학기술정보통신부 장관과 판교 IDC에서 간담회를 가졌다. 브리핑은 간담회 직후 이뤄졌다.

16일 오전 경기 성남시 분당구 SK C&C 판교캠퍼스 카카오 데이터센터 화재현장에서 소방과 경찰 관계자들이 1차 감식을 위해 이동하고 있다. 뉴스1

16일 오전 경기 성남시 분당구 SK C&C 판교캠퍼스 카카오 데이터센터 화재현장에서 소방과 경찰 관계자들이 1차 감식을 위해 이동하고 있다. 뉴스1

尹 “장관이 직접 지휘”…재난실→재난본부 격상

브리핑에서 홍진배 과기정통부 네트워크정책실장은 윤석열 대통령의 지시로 이날 오전 11시 15분부터 방송통신재난상황실이 이종호 장관 직속 방송통신재난대책본부로 격상됐다고 밝혔다. 홍 실장은 “과기정통부는 행정안전부, 소방당국 등 관계 기관과 SK C&C, 카카오, 네이버 등 장애 발생 사업자와 함께 복구를 진행했다”며 “사업자들이 전기통신사업법 등 관련 법령에 따라 이용자에 알리고 보호조치를 완료했는지 점검했다”고 밝혔다.

과기정통부에 따르면, 화재가 난 데이터센터 건물에는 16일 오전 2시쯤 전원 공급이 재개됐다. 전날 오후 3시 19분 화재가 발생해 3분 만에 데이터센터 서비스 전원이 차단된 이후 약 11시간 만이다. 홍 실장은 “중요한 부가통신서비스와 관련된 시설에 대해 전문 관리 체계를 보완하고, 필요한 제도적·기술적 방안들을 적극 검토해 개선 방안을 마련해 나갈 계획”이라고 말했다.

한편 국회 과학기술정보방송통신위원회(과방위) 의원들은 이날 오후 판교 데이터센터 화재 현장을 긴급 방문했다. 과방위 야당 간사인 조승래 더불어민주당 의원은 “필요하면 데이터센터 사업자, 카카오와 네이버 관계자를 국정감사 증인으로 불러 직접 이번 사태의 책임을 물을 것”이라고 밝혔다.

현장 브리핑 일문일답

※카카오-SK C&C-과기정통부 순으로 재구성했으며, 중복된 내용의 답변은 생략하였음.

카카오 서비스가 완전 복구되려면 얼마나 걸릴까.
양현서 카카오 대외협력실 부사장(이하 양현서) “카카오톡 이용, 카카오 서비스 이용에 불편을 끼쳐드린 점 진심으로 사죄드린다. 판교 데이터센터는 카카오의 메인 데이터센터로 약 3만 2000대 정도의 서버가 있다. 현재 큰 화재로 3만 2000대 전체의 전원 공급이 차단된 상태여서 저희가 이중화 조치가 되어있음에도 불구하고 서버를 증설하여 트래픽을 전환하는 데 꽤 많은 시간이 걸리고 있다. 현재 1만 2000대 정도가 복구된 상황이다. 오후에 전원 공급이 되면 추가적으로 서버 대기가 가능할 것으로 예상된다. 저희가 화재 현장이었기 때문에 진입이 어려운 점이 있었다. 그래서 조금 더 시간이 지연되고 있다. 현재 최선을 다하고 있지만 전원 공급에 따라 복구 시간이 언제가 될지는 확실하게 말씀드릴 수 없는 점 양해 부탁드린다.”
역대 카톡 먹통 중 복구까지 가장 오래 걸리고 있다. 늦어지는 이유는.
양현서 “카카오는 4개 데이터센터에 서버를 분산해서 사용하고 있다. 이중 판교 데이터센터가 가장 메인이다. 3만 2000대의 전원이 다운됐기 때문에 물리적 훼손도 있었고, 화재 현장이라 저희가 진입해서 어드민(admin, 관리자 내지는 사내 시스템)을 작동하는 것이 어려웠다. 보통 카톡 장애는 20분 내로 해결한다는 목표를 갖고 최우선으로 대응하는데, 현재는 서버의 손실량이 워낙 커서 장애 대응이 지연되고 있는 점, 이용자 불편을 끼쳐드리는 점 굉장히 죄송하게 생각한다. 일단 3만 2000대의 서버가 전체 다운되는 것은 IT 역사상 유례가 없는 사안이라 저희가 대처에 어려운 점이 있었다. 앞으로는 이런 상황까지 대비하여 서버 증설 등 재발 방지 대책을 더욱 강화해 다시는 이런 이용자 불편을 끼치는 일이 발생하지 않도록 최선을 다하겠다.”
카카오 고객 데이터 손실 가능성은.
양현서 “데이터는 전부 분산 저장이 되어 있고 시스템도 이중화되어 있기 때문에 데이터 손실률은 0%다.”
데이터센터 전원이 전체 차단되는 걸 가정하는 대책은 없었나.
양현서 “(한 곳에서) 전원이 내려가는 정도는 저희 기술자들이 들어가서 어드민(관리자) 설정하면 빠르게 해결할 수 있는 부분인데 어제는 아시다시피 화재 현장이었기 때문에 직접 진입해 시스템을 수리하거나 장애를 개선하는 데 물리적 한계가 있었다. 저희가 할 수 있는 최대한의 리스크 시나리오를 세우고 준비했다고 생각했으나 화재라는 것은 워낙 예상할 수 없는 사고다. 화재가 나서 서버 전체가 내려가는 상황까지는 저희가 대비가 부족했다. 내부적으로 검토하고 철저하게 조사해서 대비책을 마련하겠다.”
데이터 센터를 관리하는 화재 매뉴얼이 그대로 작동된 게 맞나.
김완종 SK C&C 클라우드 부문장(이하 김완종) “답변에 앞서 저희 데이터센터 화재로 인해 국민들께 불편을 끼쳐 진심으로 사죄드린다. 판교 데이터센터는 관련된 안전 규정을 준수하고 있다. 올해 5월에도 소방시설 종합 점검을 통해 주요 소방 기능 점검을 시행했다. 화재가 발생하자마자 화재 경보의 울림과 함께 화재 경보 단계에 따라서 자체 소화 설비가 작동되었다. 매뉴얼에 따라 신속하게 소방당국에 신고 후 진화에 협력했다. 초기 대응에도 저희 소방 시설들이 정확하게 작동했다. 그로 인해 인접 영역으로의 화재는 막아낼 수 있었다.”
화재 원인은.
김완종 “현재 정확한 화재 원인은 소방당국과 국립과학수사연구원에서 조사할 예정이다. 3일간 포렌식 등 정밀 조사를 통해 화재 원인을 식별하고, 식별된 원인에 따라 재발 방지 대책을 철저하게 수립하겠다.”
화재는 충분히 예상 가능한 재난인데 2차, 3차 전력 공급 대책이 없었나.
김완종 “이번 화재는 극단적인 워스트 케이스(worst case, 최악의 상황)였다. 데이터센터 내에 존재하는 비상 전원공급장치가 (화재가 난 전기실을 제외한 곳에) 전력을 공급했다. 그런데 전원을 전체 차단하게 된 이유는, 화재 진압을 위해 물을 사용해야 했기 때문이다. 물을 쓰면 누전으로 인한 안전 위험이 생겨 (전체) 전원을 차단하고 화재를 진압했다.”
해당 데이터센터 입주사 중 다른 기업은 피해 없나.
김완종 “IBM의 데이터센터가 있다. IBM 측과 긴밀하게 협업하고 있다. 현재 전원 공급이 재개되었고, 이에 따라 복구 작업을 진행하고 있다. SK 그룹사들도 (판교 데이터센터를) 많이 활용하고 있는데 순차적 복구가 거의 이뤄진 상태다.”
이용자 피해보상은 정부가 어디까지 개입할 예정인가. 의견 조율은 어디까지 됐나.
홍진배 과기정통부 네트워크정책실장(이하 홍진배) “손해배상에 대해서는 (과기정통부가) 전격적으로 논의할 사항이 아니다. 방송통신위원회에서 손해배상 부분은 검토하고 있는데 관계부처와 관계 기업과 함께 협의할 수 있도록 노력하겠다. 소관부처에서 추후 설명이 있을 것이라고 본다.”
이번 사태에 현행법 위반 소지 있나.
홍진배 “전기통신사업법 22조의7에 관련 규정이 있다. 규정에 따라 어제부터 자료 제출 요구를 해둔 상황이다. 어느 정도 현행법 위반인지는 조사 후 말씀드리겠다.”
이종호 과기정통부 장관이 (카카오 등) 부가통신 서비스의 중요성을 언급했다. 부가통신사업자에 대한 후속 규제 법제화 의지로 봐도 되나.
홍진배 “부가통신사업자와 기간통신사업자는 법적 지위는 물론, 보호하고 있는 여러 기술이나 제도의 경중이 다르다. 이번 원인 분석을 상세하고 정밀하게 한 후에 부가통신사업자의 경우에도 서비스의 안정성을 확보하기 위해 제도 보완이 필요한지 점검하겠다.”
대통령 지시에 따라 방송통신재난대응실을 재난대책본부로 격상했는데, 대응 수준에 차이가 있나.
홍진배 “재난 대응은 4단계로 돼 있다. 방송통신재난대책본부는 가장 상위 단계의 대응이다. 우리 부처 뿐 아니라 관계부처 협업으로 대응하는 등 가장 높은 수준으로 대응한다고 보면 된다. 제도적 보완 사항 도출이나 사고원인 조사 등을 넘어서 우리가 가진 기술적 보완조치 등 부내 모든 역량을 총동원해서 장관 지휘 아래 진행할 것이다. 소방 당국과의 협업도 할 것이다.”
ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT
Innovation Lab