ADVERTISEMENT

상습 고액체납자 1조5000억 징수 일등공신은 빅데이터 AI 분석

중앙일보

입력

업데이트

정철우 국세청 징세법무국장이 지난 5일 정부세종2청사 국세청 기자실에서 빅데이터 분석을 통한 체납조사 방식을 설명하고 있다. 뉴스1

정철우 국세청 징세법무국장이 지난 5일 정부세종2청사 국세청 기자실에서 빅데이터 분석을 통한 체납조사 방식을 설명하고 있다. 뉴스1

빅데이터 분석의 활용도가 날로 커지고 있다. 단순히 데이터를 수집해 결과값을 보여주는 것뿐 아니라, 문제 해결을 위한 해법까지 제시하는 형태로 진화하면서다. 최근 국세청이 빅데이터를 활용한 체납조사를 실시, 상습 고액체납자로부터 1조5000억원을 징수한 것이 대표적인 사례다.

국세청, 체납자 조사에 AI와 빅데이터 활용 #지난해 7월 빅데이터센터 출범 8개팀 구성

‘숨은 돈’ 찾아낸 AI 빅데이터 분석

국세청의 고액체납자 추적조사에는 LG CNS의 인공지능(AI)을 활용한 빅데이터 분석이 일부 활용됐다. 올해 8월까지 국세청이 1조 5000억원이 넘는 세금을 징수할 수 있었던 이유다. 과거 일일이 수작업으로 했던 체납자 선정부터 재산 은닉 확인까지 빅데이터 분석이 대신하면서 시간은 빨라지고 정확도는 높아졌다. 국세청의 빅데이터 분석은 방대한 정보가 활용됐으며 공공ㆍ민간을 통틀어 최대 규모인 것으로 알려졌다.

빅데이터 분석을 통한 고액 체납 추적 대상자 선정. 그래픽=박경민 기자 minn@joongang.co.kr

빅데이터 분석을 통한 고액 체납 추적 대상자 선정. 그래픽=박경민 기자 minn@joongang.co.kr

실제로 국세청은 빅데이터를 통해 부동산을 옛 동거인에게 이전하거나 친인척 명의로 해외에 송금해 자산을 숨긴 사람들을 찾아냈다. 이들의 주민등록 정보, 외환거래, 소득ㆍ지출 내역 등 빅데이터를 분석한 결과다. 주민등록상 주소지가 아닌 곳에 거주하는 것으로 분석된 체납자 28명의 실거주 추정 장소를 수색한 결과 24명을 찾아내 12억원을 징수하고, 23명을 체납처분 면탈범으로 고발하기도 했다.

민병석 LG CNS 전문위원은 “빅데이터 분석은 통계값을 나타내는 일회성 분석에 그치는 것이 아니라 이를 바탕으로 추론하고 실제 서비스까지 심리스하게 적용할 수 있느냐가 중요하다”면서 “해외에서도 이런 모델을 만들기 위해 노력하고 있는데, 국세청의 빅데이터 분석은 하나의 선진사례로 평가할 수 있다고 본다”고 말했다.

다양한 영역에서 활용 중인 빅데이터  

AI 빅데이터 분석에는 다양한 업체들이 뛰어들어 각축전을 펼치고 있다. 해외에서는 구글이나 아마존 같은 데이터 접근성이 가장 뛰어난 클라우드 업체들이 가장 적극적이다. 국내에서도 LG CNS뿐 아니라 삼성 SDSㆍSK C&C 등이 AI 빅데이터 분석 플랫폼을 제공하고 있다.

최근 국내에서도 화장품 제조사 보험사 등 다양한 업체들까지 AI 빅데이터 분석을 속속 도입하는 추세다. 가령 화장품 제조사인 A사는 RFM(구매시점ㆍ빈도ㆍ구매액)을 활용한 통계분석에서 빅데이터 분석을 도입하면서 매출이 증가했다. 보험사인 B사는 장기보험 인수심사 업무에 AI 분석을 도입하면서 1년 치 60만~70만 건의 데이터를 학습하여 99.5%의 예측정확도를 나타냈다.

데이터댐 사업으로 빅데이터 생태계 확장 전망  

시장조사업체 위키본에 따르면 세계 데이터 시장 규모는 2018년 420억 달러로 2022년까지 5년간 연평균 11.1%의 성장세를 유지하며 710억 달러로 몸집이 커질 것으로 전망된다. 국내 시장 역시 정부가 추진 중인 ‘디지털 뉴딜’의 핵심사업인 데이터댐(데이터 활용 신사업)의 가동으로 더욱 확장될 전망이다. 이 사업은 말 그대로 댐 안에 물을 가두듯, 공공ㆍ민간 데이터를 수집ㆍ가공해 산업 전반에 활용토록 하는 것을 말한다. 정부는 이를 통해 2만800여개의 일자리가 생기고 AI 활용이 산업 전반으로 확대될 것으로 기대하고 있다.

글로벌빅데이터시장전망. 그래픽=김경진 기자 capkim@joongang.co.kr

글로벌빅데이터시장전망. 그래픽=김경진 기자 capkim@joongang.co.kr

다만 업계에서는 우려의 목소리도 있다. 익명을 원한 데이터 전문가는 “댐에 가둬진 물이 오염된 물이라면 쓸모가 없는 것처럼 데이터 역시 수집 단계부터 어떤 데이터를 어떻게 활용할지 고민해서 설계해야 한다”면서 “만약 무턱대고 데이터를 모은다면 활용은 못 하고 돈만 들어가는 기술 부채로 전락할 것”이라고 지적했다.

장주영 기자 jang.jooyoung@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT