“10년 전 판교 회사 마인드론 안돼, 서버·보안체계 새로 짜야”

중앙일보

입력

업데이트

17일 경기도 용인의 한 B2C(기업과 개인 간 거래) 서비스 스타트업 사무실. 월요일 오전 출근한 직원들은 곧바로 DR(Disaster Recover, 재해 복구 시스템) 체계 점검 관련 회의를 열었다. 주말 사이 발생한 카카오 서비스 먹통 사태를 보고 ‘우리 앱 데이터 이원화 체계는 어떤가’를 점검하는 자리였다. 회사 관계자는 “재난 상황이 발생했을 때 백업 시스템의 작동, 임차해서 쓰는 데이터센터의 소통 방법에 대해 정확한 매뉴얼을 만들어두지 못한 것이 사실”이라며 “데이터 이원화, 핫 사이트(비상 시 대비한 백업 사이트) 구축에 더 많은 예산을 집행하기로 했다”고 설명했다.

정보기술(IT) 전문가는 이번 카카오 먹통 사태에 대해 “IT 서비스 기업이라면 규모와 상관없이 데이터·서버·보안시스템을 점검하고 새로 정립하는 계기로 삼아야 한다”고 조언한다. 구체적으로 어떤 대비를 해야 하는지 전문가에게 들었다. 카카오는 그간 자체 인터넷데이터센터(IDC) 없이 4개 지역 데이터센터를 임차해 썼는데, 그중 한 곳인 경기도 판교 SK C&C 데이터센터에 대부분의 서버가 집중해 있다 보니 화재로 인한 피해가 컸다. 익명을 요구한 중견 IT 기업 최고기술책임자(CTO)는 “국내 최대 IT 기업의 백업 시스템치고는 너무 안이했다”며 카카오의 백업 시스템을 비판했다. 그는 “카카오 서비스의 규모가 큰 만큼 데이터·서버 백업 비용도 천문학적으로 커진다”면서도 “IT 대기업인 카카오가 이를 제대로 대비하지 않았다는 건 10년 전 ‘판교 회사 마인드’에서 벗어나지 못한 것”이라고 지적했다.

관련기사

국내 AI(인공지능) 기술 관련 스타트업의 한 임원은 “국내 IT 서비스가 본격적으로 커진 이후 전쟁·지진 등으로 인한 셧다운 경험이 많지 않았다”며 “카카오는 이용자는 많아도 국내 서비스가 대부분이기에 구글이나 페이스북처럼 자체 IDC를 일찌감치 만들어 글로벌 리전까지 구성할 경험과 기술이 없었던 것 같다”고 지적했다. 글로벌 리전이란 데이터센터를 여러 대륙·국가에 걸쳐 복수로 운영하는 체제를 가리킨다.

미국 실리콘밸리에서 글로벌 협업 툴인 ‘스윗’을 운영하는 이주환 스윗테크놀로지스 대표는 “클라우드 기반의 서비스형 소프트웨어(SaaS)는 서비스를 중단 없이 고객에게 제공하는 것이 가장 중요하다”며 “업계에서는 99.9999%(1년에 약 30초의 서비스 중단이 발생하는 것)의 서비스 가용성(SLA, 서비스 수준 협약)을 제공하는 것을 공통 목표로 삼고 있는데, 이를 달성하려면 대륙별·국가별로 서버를 분산시켜 둘 필요가 있다”고 했다.

사고 후 지난 16일 현장 브리핑에서 양현서 카카오 부사장은 “사고 발생 20분 이내에 복구하는 것이 매뉴얼인데 서버 손실량이 워낙 크다”며 서비스 정상화가 늦어진 것을 해명했다. 이에 대해서도 전문가들은 “카카오가 사실상 재해·재난 발생 대비 매뉴얼을 제대로 갖추지 못했다는 얘기”라고 지적한다.

익명을 요구한 한 IT 기업 최고경영자(CEO)는 “IT 서비스 기업이라면 재난 복구 지원센터를 상시 운영하면서 사고 발생 직후부터 2시간, 5시간 등 시간대별로 현 상황과 이용자 데이터 보관 방식을 실시간으로 알려야 한다”고 지적했다.

하선영 기자 dynamic@joongang.co.kr