ADVERTISEMENT

'exit' 하나 빠져 전국 마비…'세 번의 과실'이 빚은 KT 먹통 사태

중앙일보

입력

업데이트

홍진배 과학기술정보통신부 정보보호네트워크정책관이 29일 정부서울청사 브리핑실에서 25일 발생한 KT 네트워크 장애 원인분석 결과를 발표하고 있다. [연합뉴스]

홍진배 과학기술정보통신부 정보보호네트워크정책관이 29일 정부서울청사 브리핑실에서 25일 발생한 KT 네트워크 장애 원인분석 결과를 발표하고 있다. [연합뉴스]

‘세 번의 과실이 불러온 참사’.
지난 25일 전국적 통신 대란을 불러온 KT의 네트워크 장애는 KT의 안이함이 겹치고 겹쳐 발생한 사고로 드러났다.

과학기술정보통신부는 29일 오후 전문가로 구성된 민관합동 사고조사반의 조사 결과를 발표했다. 조사 결과에 따르면 현장 작업자의 사소한 ‘실수’가 전국의 통신망을 마비시키는 ‘재난’이 될 때까지, 최소 3번의 과실이 있었다. 다시 말해, 재난을 막을 수 있었던 3번의 기회가 있었지만 이를 모두 놓쳤다는 의미다.

➀야간작업 주간에 하다 ‘exit’ 누락

과기정통부가 로그 기록을 분석한 결과 사고는 25일 오전 11시쯤 KT부산국사에서 기업망 라우터(네트워크 경로 설정 장비) 교체 작업 중 발생했다. 애초 KT 네트워크관제센터는 ‘교체 작업을 26일 오전 1∼6시에 진행하라’고 승인했지만, KT와 외주업체는 임의로 트래픽이 가장 몰리는 시간인 월요일 오전 11시에 작업을 했다.

사고의 직접 원인은 외주업체 직원의 실수였다. 외주업체 직원이 교체 장비의 ‘라우팅’(네트워크 경로 설정)을 하다가 정보를 입력하는 과정에서 들어가야 할 명령어 중 ‘엑시트’(exit)라는 한 단어를 빠뜨린 것이다. 이 때문에 통상 BGP(외부 라우터와 경로 정보를 주고받는 프로토콜)에 들어가야 할 경로 정보가 IS-IS(내부 라우터 간 경로 정보를 주고받는 프로토콜)로 한 번에 몰리면서 오류가 발생했다.

통상 1만 건 내외 정보를 교환하는 IS-IS 프로토콜에 그 수십 배 규모인 BGP 정보가 엉뚱하게 전송된 결과 라우팅 경로에 오류가 발생한 것이다. 전체 스크립트(명령글)에 오류가 있는지를 확인하는 사전검증 단계가 두 차례나 있었지만, 여기서도 해당 오류가 걸러지지 않았다.

‘주간에 해야 하는 작업을 왜 야간에 했는지’에 대해 KT가 내놓은 해명은 이번 사태가 그간 누적된 안이한 태도에서 발생했음을 보여준다. 홍진배 과기정통부 정보보호네트워크정책관은 규정을 어기고 주간 작업을 진행한 이유에 대해 “협력업체 직원들과 KT 관리자에게 직접 확인한 결과, ‘야간작업을 좋아하는 사람은 없기 때문에 주간작업을 선호한 것’으로 진술했다”고 말했다.

➁사고 시각, 현장에 없던 KT 직원

조사 결과 사고가 난 시각 현장에 KT 직원은 없었던 것으로 드러났다. 국가기간통신망 사업자인 KT가 가장 핵심 사업인 네트워크 작업을 외주업체에 맡겨놓고 이를 관리·감독조차 하지 않았다는 것이다. 이 때문에 네트워크가 연결된 채로 라우팅 작업을 진행하는 등 관리적 측면에 문제점이 있었다. 최성준 과기정통부 네트워크정책과장은 “잘못된 정보 입력 시 KT 직원은 다른 업무를 하느라 자리를 비운 상태였다”고 말했다.

➂‘실수’가 ‘재난’이 되는 것을 방지하는 시스템 부재

부산에서 발생한 사고로 전국의 네트워크망이 엉망이 되는 데 걸린 시간은 단 ‘30초’였다. 부산국사 라우터의 잘못된 경로 설정이 다른 지역 IS-IS에도 전달되면서 전국적으로 오류가 확산됐다. 조사 결과에 따르면 KT의 IS-IS 프로토콜은 잘못된 데이터 전달에 대한 안전장치 없이 전국을 하나로 연결하고 있었고, 하나의 잘못된 경로 업데이트가 전국 라우터에 연쇄적으로 일어나면서 장애가 전국으로 확산했다. 애초에 한 개의 라우팅 오류만 생겨도 전국의 라우터에 오류를 일으킬 수 있는 시스템이었다.

허성욱 과기정통부 네트워크정책실장은 “네트워크 작업을 야간에 하거나, 이런 작업을 미리 테스트하는 등의 규칙은 10여년 전부터 있었던 기본 상식”이라며 “관리자 없이 협력업체가, 그것도 주간에 이런 사고가 나왔다는 게 파란 불에 신호를 건너지 않아서 교통사고가 난 것과 같이 생각조차 못 했던 사고라 저희도 당황스러운 건 사실이다”고 말했다.

ADVERTISEMENT
ADVERTISEMENT