빅데이터 분석의 활용도가 날로 커지고 있다. 단순히 데이터를 수집해 결과값을 보여주는 것뿐 아니라, 문제 해결을 위한 해법까지 제시하는 형태로 진화하면서다. 최근 국세청이 빅데이터를 활용한 체납조사를 실시, 상습 고액체납자로부터 1조5000억원을 징수한 것이 대표적인 사례다.
‘숨은 돈’ 찾아낸 AI 빅데이터 분석
국세청, 체납자 조사에 AI와 빅데이터 활용
지난해 7월 빅데이터센터 출범 8개팀 구성
실제로 국세청은 빅데이터를 통해 부동산을 옛 동거인에게 이전하거나 친인척 명의로 해외에 송금해 자산을 숨긴 사람들을 찾아냈다. 이들의 주민등록 정보, 외환거래, 소득ㆍ지출 내역 등 빅데이터를 분석한 결과다. 주민등록상 주소지가 아닌 곳에 거주하는 것으로 분석된 체납자 28명의 실거주 추정 장소를 수색한 결과 24명을 찾아내 12억원을 징수하고, 23명을 체납처분 면탈범으로 고발하기도 했다.
민병석 LG CNS 전문위원은 “빅데이터 분석은 통계값을 나타내는 일회성 분석에 그치는 것이 아니라 이를 바탕으로 추론하고 실제 서비스까지 심리스하게 적용할 수 있느냐가 중요하다”면서 “해외에서도 이런 모델을 만들기 위해 노력하고 있는데, 국세청의 빅데이터 분석은 하나의 선진사례로 평가할 수 있다고 본다”고 말했다.
다양한 영역에서 활용 중인 빅데이터
최근 국내에서도 화장품 제조사 보험사 등 다양한 업체들까지 AI 빅데이터 분석을 속속 도입하는 추세다. 가령 화장품 제조사인 A사는 RFM(구매시점ㆍ빈도ㆍ구매액)을 활용한 통계분석에서 빅데이터 분석을 도입하면서 매출이 증가했다. 보험사인 B사는 장기보험 인수심사 업무에 AI 분석을 도입하면서 1년 치 60만~70만 건의 데이터를 학습하여 99.5%의 예측정확도를 나타냈다.
데이터댐 사업으로 빅데이터 생태계 확장 전망
다만 업계에서는 우려의 목소리도 있다. 익명을 원한 데이터 전문가는 “댐에 가둬진 물이 오염된 물이라면 쓸모가 없는 것처럼 데이터 역시 수집 단계부터 어떤 데이터를 어떻게 활용할지 고민해서 설계해야 한다”면서 “만약 무턱대고 데이터를 모은다면 활용은 못 하고 돈만 들어가는 기술 부채로 전락할 것”이라고 지적했다.
장주영 기자 jang.jooyoung@joongang.co.kr