ADVERTISEMENT

빅데이터가 그러는데 이 명품백, 짝퉁이래요

중앙일보

입력

업데이트

지면보기

경제 04면

#인천공항 수입화물 세관에 핸드백 여러 개가 신고됐다. 화물분석과의 담당관은 컴퓨터 화면을 먼저 들여다본다. 수입신고서에 기재된 출항지 정보가 자동으로 뜬다. ‘중국 광저우’. 빅데이터 분석 시스템은 ‘최근 지적재산권 위반 품목(짝퉁) 적발 횟수가 많은 지역’이라며 우범 지수를 표시했다. 품목을 신고한 업체가 과거 짝퉁 적발 전력이 있음도 확인됐다. 우범 지수가 올라갔다. “뜯어보자.” 역시나 이탈리아 명품 브랜드의 짝퉁 제품으로 확인됐다. 관세청은 이 같은 방식으로 연간 총 1조 2000억원어치가 넘는 짝퉁 명품을 적발하고 있다.

 #국내 의료·요양 기관의 보험급여와 서비스 적절성을 심사하는 건강보험심사평가원. 전국 병원에서 보험 처방한 약제 데이터가 확인된다. ‘이 병원은 두 알 이상 항생제를 처방한 횟수가 많은데?’ 담당자가 컴퓨터 화면에서 병원 분류를 클릭하자 같은 급의 전국 의료기관 평균 처방률과의 비교 수치가 한번에 나온다. 투약 기간과 약의 개수, 환자의 중증도를 함께 볼 수 있다. 이 시스템으로 감시한 결과, 2010년 전국 항생제 처방률 80% 이상인 의원 2301곳이 지난해 1208곳으로 절반이 됐다.

 빅데이터가 ‘공익 탐지견’으로 나섰다. 기업들의 마케팅 수단 정도로 여겨지던 데에서 탈세와 복지수당 불법 수급 같은 지하경제를 잡아내고 범죄나 의료서비스 오·남용을 예방하는 공공 영역에 활용되는 것이다. 갈수록 진화하는 각종 불법 행위를 사람의 눈썰미만으로 잡아내기에는 역부족. 이제는 과학과 데이터가 범인을 잡는 시대다.

 관세청은 불법 수입화물을 골라내기 위해 2008년 빅데이터 기반의 탐지 시스템을 구축했다. 수출입 화물량이 급증해 원산지 허위 표시 물품, 불법 먹거리, 지적재산권 위반품 등을 걸러내는 통관 업무가 10년간 100배 이상 늘었는데, 인력은 그걸 따라가지 못했다. 관세청은 소프트웨어 업체인 SAS코리아와 함께 ‘위험 관리 솔루션’을 만들었다. 먼저 관세청에 그간 쌓인 관련 데이터를 분석해 가설을 만들었다. 원산지와 물품 종류, 신고업체, 수입 경로 등을 통합적으로 분석해 짝퉁 제품의 특성을 도출했고, 이에 따라 불법 물품일 가능성을 나타내는 우범지수가 자동으로 매겨졌다.

 이 시스템을 사용하자 전국 세관의 중요 사항 적발률이 20% 이상 늘었다. 검사의 정확도가 높아지고 관세 업무가 효율화된 것이다. 뜯어서 검사해 봤는데 합법 화물인 경우도 대폭 줄어 수입 업체도 만족했다. 관세청 관세평가분류원 김병규 계장은 “전국으로 들어오는 모든 수입품을 이 솔루션을 통해 관리한다”며 “국내 수입 화물이 폭증하고 있어 과거 데이터를 분석해 잠재 위험성을 예측하는 것”이라고 말했다. 인천공항세관 김규진 담당관은 “전 세계에서 통관업무가 24시간 이뤄지는 곳은 우리나라뿐”이라며 “데이터 분석을 도입한 덕에 인력 부족을 그나마 메우고 있다”고 말했다.

  업무의 폭증은 복지나 의료 분야도 마찬가지다. 건강보험심사평가원은 요양급여 비용 심사 건수가 1980년 1644건에서 2012년 14억 건으로 85만 배 늘었다. 2011년 빅데이터 기반의 평가분석 시스템을 도입해 연간 100억 건 이상 데이터를 분석해 과학적인 심사 지표를 개발했다. 수술 예방 항생제는 개복 1시간 내 투여할 때 효과가 높은데 그 전에 미리 투여했거나 퇴원 후에도 지속적으로 쓴 경우 등을 구분하는 식이다. 매월 이 같은 평가를 실시해 의료기관별 컨설팅을 해주고, 국민들이 볼 수 있도록 홈페이지에 정보도 공개한다.

 이 같은 빅데이터의 공공 활용은 해외에서 이미 보편적이다. 미 국세청은 탈세를 막기 위해 ‘탈세 및 사기 범죄 방지 시스템’을 구축해 연간 3450억 달러의 세금 누락을 잡아냈다. 계좌·주소·전화번호·납세자 간의 연관관계를 분석했고, 페이스북이나 트위터를 통해서도 범죄자 간 인맥을 찾아낸 것이다. 중국 관세청도 37개 지역 세관에 빅데이터 시스템을 만들었더니 2년 만에 연간 2000만 달러의 세금 누수를 막을 수 있었다.

 복지 예산이 새는 것을 막는 ‘수도꼭지’ 역할도 한다. 미 LA 카운티 사회복지국은 취약계층 복지수당의 불법 수급을 막기 위해 SAS 솔루션을 도입했다. 병원·보험기관과 협력해 약 45억 개의 데이터를 분석했고, 수당 신청자의 소득 자료, 납세 내역, 가입한 보험, 주변인과의 관계 분석도 했다. 종합적으로 살폈더니 거주지에서 먼 보육센터에 수당을 신청했거나 동일한 전화번호로 여러 곳에 중복 신청한 사례가 속속 발견됐다. 이렇게 적발된 부정 수급 사례는 200여 건. 사전 탐지율은 85%까지 높아졌고, 연간 3100만 달러 예산이 새는 것을 막았다. 영국 보건부도 빅데이터 분석을 도입해 지난 8년간 6억7100만 파운드의 부정 의료보험 수급을 예방했다. 시스템 구축에 들인 비용의 13배에 해당하는 재정 수익이다.

 치안에도 활용된다. 미국 뉴욕 경찰청은 마이크로소프트와 함께 범죄정보시스템(DAS)을 개발해 지난해부터 시에 적용했다. 경찰과 미 중앙정보국(CIA), 미 연방수사국(FBI)이 보유한 3000개의 CCTV 화면과 신고 전화, 용의자 체포 기록, 자동차 번호판 추적 결과 방사선 수치 같은 방대한 자료를 클릭 한번에 확인하는 기술이다. 신고 전화를 받는 동시에 경찰청 담당자의 시스템 화면에서 해당 구역에 있는 경찰, 신고 직전 30초간 촬영된 CCTV 화면, 범죄 발생지 반경 500m 내의 정보를 즉시 파악한다. 영국 사우스웨일스 경찰은 SAS 솔루션을 활용해 범죄 유형별 맞춤 대응 시나리오를 만들었다. 그러자 도입 1년 만에 해당 지역의 범죄 발생률이 전년 대비 11.8% 줄 었다.

 국내에서도 빅데이터의 전면 도입 목소리가 커지고 있다. 지난해 말 국가정보화전략위원회는 경찰청의 범죄 기록에 날씨·지역정보·인구통계·유동인구 같은 자료를 종합해 장소와 시간대별 범죄 발생 가능성을 도출하는 시스템을 구축하겠다고 밝힌 바 있다.

심서현 기자

ADVERTISEMENT
ADVERTISEMENT