ADVERTISEMENT

[단독] 52억짜리 AI 수사관 '클루' 가 '살인의 추억' 재발 막는다

중앙일보

입력

업데이트

2019년 X월 X일 오후 2시, 서울 마포경찰서에서 근무하는 김 형사는 경찰청 범죄 분석 요원에게 ‘클루’ 정보를 요청했다. 입력 조건에 ‘서울 마포구’, ‘침입 절도’, ‘평일’, ‘오후 2~5시’, ‘흐린 날씨’를 입력해 달라고 했다. 잠시 후 마포구 ○○번지 단독주택가 반경 2㎞가 원으로 표시된 파일을 받았다. 김 형사는 관할 지구대에 오후 5시까지 이 지역에 대한 순찰 강화를 요청했다.

해당 지역에서 잠복근무하던 지구대 경찰관들은 야구 모자를 눌러 쓰고 같은 길을 반복해 지나는 수상한 사람을 발견했다. 경찰이 가까이 가자 그는 갑자기 도주하기 시작했다. 검거한 뒤 경찰이 그의 신원을 확인해보니 석 달 전 서울의 다른 지역에서 주택에 침입해 절도 행각을 벌인 수배자였다. 그의 집에서 석 달 전에 도난당한 물품들이 발견됐다.

 2003~2004년 20명을 연쇄 살인한 유영철의 사건을 다룬 영화 '추격자' [사진 영화 '추격자']

2003~2004년 20명을 연쇄 살인한 유영철의 사건을 다룬 영화 '추격자' [사진 영화 '추격자']

이 미래의 가상 사례에 등장한 ‘클루’는 경찰청이 개발 중인 빅데이터 기반의 첨단 범죄 분석 프로그램이다. 클루는 범죄 경향을 자세히 분석하고, 과거의 유사 사건 제시를 통해 수사 단서를 제공한다. 또 앞으로의 범죄 발생을 예측하기도 한다. 일종의 인공지능(AI) 시스템이다.

클루(CLUE)는 ‘범죄 분포 이해 도구(Crime Layout Understanding Engine)’의 축약 표현이다. ‘Clue’는 ‘단서’라는 의미의 단어이기도 하다. 경찰청 관계자는 “현재 약 65% 개발된 상태다”고 8일 말했다. 클루가 완성되면 영화 ‘살인의 추억’의 소재인 경기 남부 살인 사건 같은 연쇄 범죄를 미리 막고, 다양한 범죄 수사에 큰 도움을 받을 것으로 경찰은 기대하고 있다.

그래픽=박경민 기자 minn@joongang.co.kr

그래픽=박경민 기자 minn@joongang.co.kr

경찰청은 ‘빅데이터를 적극적으로 활용하라’는 정부 방침에 따라 지난해 2월부터 클루 개발을 시작했다. “치안과 관련된 최신 과학 기술에 관한 연구를 확대해야 할 때”라는 경찰 안팎의 분위기도 한몫했다. 경찰청은 내년 말까지 클루의 개발을 마치고 2019년 초부터 시범 운영할 계획이다. 3년간의 총 연구·개발 예산은 52억4000만원이다. 그중 내년 예산 14억1000만원은 최근 국회에서 승인받았다.

◇경찰의 ‘수사 결과 보고서’ 자동으로 인식

클루가 이런 기능을 하기 위해서 필요한 ‘원료’는 두 가지다. 경찰이 보유한 범죄 관련 데이터와 공공 데이터(날씨, 연령별·성별 인구, 공시지가 등)다. 공공 데이터는 일반에 공개된 것들을 활용한다.

경찰의 범죄 관련 데이터는 경찰이 수사를 종결할 때 작성하는 ‘수사 결과 보고서’다. 클루가 자연어 처리 기법으로 자동으로 읽게 된다. 사람이 쓴 글에서 범행 도구, 범행 의도, 피해 규모 등 100여 개의 요소를 뽑아내 자동으로 분류하고 저장한다. IBM의 최신 자연어 처리 프로그램이 사용됐고, 자연어 처리 전문 업체가 참여했다.

이 작업에 참여한 빅데이터 분석 소프트웨어 개발업체 ‘스펠릭스’의 박성진 이사는 “경찰들도 각자 사용하는 단어와 문장 구성이 달라 클루가 이를 정확히 이해하게 하는 게 어려웠다. 하지만 경찰 실무자가 상주하면서 수정에 수정을 거듭해 지금은 정확도가 상당히 올라간 상태다”고 말했다.

관련기사

◇수사 단서 제공하고 미래의 범죄도 예측하는 ‘AI 해결사’

서울 종로구의 한 단독주택에서 가사 도우미를 둔기로 때려 기절시킨 뒤 현금과 귀금속을 턴 강도 사건이 발생했다. 신고를 받고 출동한 경찰관은 범인이 마스크로 얼굴을 가리고 야구방망이로 가격했다는 사실을 확인했다. 경찰관은 즉각 경찰청에 ‘클루’ 분석을 요청했다. 최근 1년 새 야구방망이 강도 사건 5개가 검색됐다. 그중 4개가 종로구와 성북구의 주택가에서 오전 10시~낮 12시 사이에 대형 단독주택에서 일어난 것으로 나타났다. 클루는 범죄 발생 지역의 공통점과 주변 폐쇄회로TV(CCTV) 영상 분석을 통해 10명의 용의자 모습이 담긴 동영상을 찾았다. 클루가 수사 단서를 제공하는 가상의 상황이다.

클루가 이처럼 수사에 중요한 단서를 알려주거나 미래의 범죄를 예측할 것으로 기대하는 이유는 범죄를 구성하는 여러 세부적인 조건과 방대한 범죄 데이터를 신속히 분석할 수 있기 때문이다. 유사한 범죄가 발생할 가능성을 계산하고, 상습범의 범행 패턴도 찾아낼 수 있다.

이런 클루의 능력은 베테랑 형사의 ‘감’보다 더 정확할 수 있다. 수사 중인 사건의 발생 시간, 날씨, 흉기의 종류, 범행 수법, 피해 규모, 공범 여부, 범인의 특이 성향, 침입ㆍ비침입 여부, 면식ㆍ비면식 여부 등 약 90개의 조건을 입력하면 과거 유사 사건을 1위부터 순서대로 찾아내 보여준다. 수사 초기에 경찰이 방향을 설정하고 범위를 좁히는 데 큰 도움이 될 수 있다.

일러스트=심수휘

일러스트=심수휘

◇범죄 예상 지역을 정밀하게 알려줘

주목받는 클루의 또 다른 기능은 ‘범죄 예측’이다. 특정 지역, 시간, 지역, 날씨 등 배경 조건과 함께 범죄 유형(침입 절도, 강도, 성폭행 등)을 입력하면 그 범죄가 일어날 가능성이 가장 높은 지역을 반경 2㎞ 내외의 원으로 지도에 표시해준다. “특정 범죄가 자주 발생했던 지역을 붉은색으로 표시하는 과거의 기초적인 분석과는 차원이 다른 예측”이라는 게 경찰의 설명이다. 특정 지역의 날씨, 공시지가, 연령별ㆍ성별 인구 등도 분석에 적용된다. 경찰은 특정 지역의 기초생활보장 수급자 수, 1인 가구 수, 에너지 소비량, CCTV 수, 업종별 사업체 수 등 52종 1억3000여 건의 공공 데이터를 활용할 계획이다.

빅데이터 분석 업체 ‘베가스’의 윤석용 부사장은 “방대한 데이터에 여러 가지 알고리즘을 복합적으로 적용해 분석하는 ‘하이퍼 머신 러닝’ 기법을 적용해 예측의 정확성을 높였다. 클루는 바로 어제 종결된 사건의 데이터도 실시간으로 받아들여 생생한 예측을 한다”고 말했다.

클루에 가진 복합알고리즘의 핵심은 최신 범죄 이론 중 하나인 ‘근접반복행위 이론’이다. ‘범죄자들은 자신이 범행하기 유리한 조건을 찾아 합리적으로 범행한다’는 가설에 근거한 이론이다. 클루는 분석된 범죄의 여러 세부 조건들에 해당하는 지역들, 즉 해당 범죄가 일어날 가능성이 높은 지역을 찾아내 미리 지도에 표시해준다.

◇절도·강도·방화·성폭행 범죄 잘 해결

경찰은 클루가 절도ㆍ강도ㆍ방화ㆍ성폭행 등의 상습성 범죄 해결에 특히 기여할 것으로 예상하고 있다. 비슷한 조건과 상황에서 범죄가 발생하기 때문에 예측 정확성이 클 것으로 보고 있다. 경찰은 또 이미 검거한 피의자의 다른 범죄 연루 확인이나 연쇄 사건과 미제 사건을 해결하는 데도 클루가 기여할 것으로 믿고 있다.

클루는 범죄의 경향도 자세히 분석할 수 있다. 빅데이터 분석을 통해 다양한 범죄 구성 요소 및 상호 간의 관계를 따져보고, 사건끼리 유사한 정도도 판단한다. 전국을 작은 지역(가로 500m, 세로 400m)들로 나눠, 해당 지역의 세부적인 범죄 현황이나 범행 수법의 변화도 조망할 수 있도록 한다. 여기에는 서울대 통계연구소와 빅데이터 분석 전문 업체가 참여했다.

'클루'에 대한 의문과 답

경찰은 “클루가 완성되면 앞으로 발생할 범죄를 예측하는 것도 가능하다"고 밝혔다. 이에 따라 일어나지도 않은 범죄 발생을 예상해 미래의 범죄자를 미리 체포하는 내용을 담은 영화 ‘마이너리티리포트’가 연상된다는 얘기도 나온다. 클루 개발을 담당하는 ‘킥스’ 담당 경찰청 간부에게 물었다. 킥스(KICS)는 전자화된 수사 기록을 저장하는 경찰 내부망이다.

-경찰이 쓴 ‘수사 결과 보고서’를 클루가 얼마나 정확하게 이해할 수 있나.
“사람이 읽는 것처럼 완벽하게 하려면 더 많은 예산을 투입해 보완하는 긴 과정을 거쳐야 한다. 하지만 지금 개발 중인 수준으로도 수사기록에서 100여 개 이상의 범죄 요소를 인식하는 것은 충분히 가능하다.”

-어느 정도까지 구체적인 수사 단서를 제공해 주나.
“구체적인 범행 수법과 수법의 변화 경향, 수법 간의 연관성 등도 알 수 있다. 단독 주택 침입 절도는 주로 어떤 날씨에, 몇 시쯤에 발생하고, 주로 어떤 물건을 노리는 것인지 등도 매우 구체적으로 제시될 것으로 기대하고 있다.”

-미래의 범죄자를 예측하는 영화 '마이너리티리포트' 같다는 우려도 있다.
“그것과는 거리가 멀다. 클루는 개인정보를 사용하지 않는다. 특정 개인에 대한 프로파일링이 불가능하다는 얘기다. 클루의 분석 결과만으로 피의자를 특정할 수 있는 경우는 발생하지 않는다. 또 클루의 분석 결과는 법적 효력이 없고 수사기록에도 첨부되지 않는다.”

-해킹에 대한 우려는 없나.
“클루는 경찰의 내부망인 ‘킥스(KICS)’에서만 구동된다. 킥스는 외부와 연계되지 않은 완전히 폐쇄된 망으로, 이중 방화벽, 구간 암호화, 침입 방지 시스템 등 8단계의 기술적 보안 장치가 돼 있다.”

-클루 정보가 외부로 유출될 수도 있을 것 같은데.
“경찰 중에서도 사건을 취급하지 않는 사람은 내부망인 ‘킥스’에 접근할 수 없다. 접속 기록도 모두 로그 기록으로 남는다. 클루는 그중에서도 일정한 절차를 거쳐 권한을 부여받은 소수의 요원만 사용하는 방안을 고려 중이다.”

-외국 경찰의 범죄 분석 프로그램과 비교하면 어떤가.
“자연어 처리, 인공지능 분석까지 탑재한 범죄 분석 프로그램 개발은 우리나라 경찰이 최초인 것으로 알고 있다. 경찰 입장에서 보면 우리나라는 형사사법 업무처리가 전자화돼 있는 거의 유일한 국가다. 미국 등 많은 국가는 혐의 명, 범행 시기, 장소 등 정해진 데이터들만 저장된다. 우리나라는 이보다 훨씬 많은 범죄 관련 비정형 데이터들이 전자화돼 있어 ‘원료’가 더 많다.”

송우영 기자 song.wooyeong@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT