심야버스 히트 쳤죠, 다음 차례는 바로 잡히는 택시

중앙일보

입력

업데이트

김경서 단장의 눈에는 서울 지도가 디지털데이터의 집합체로 보인다. 지난해 9월 내놓은 심야전용 올빼미버스도 서울 시내를 너비 1㎞의 육각형 지역으로 나누고, 빅데이터를 분석해 버스노선을 정했다. [김형수 기자]

김경서(46) 다음소프트 창립자 겸 전(前) 대표의 직업은 ‘사람들의 마음을 읽는 것’이다. 독심술사나 점쟁이는 아니다. 독심술사가 타고난 재주로 특정 사람의 마음을 읽는다면, 그는 빅데이터(Big Data)를 분석해 개인이 아닌 ‘사람들’의 생각을 읽어낸다. 그는 이를 ‘마이닝 마인즈(mining minds)’라고 이름 지었다. 광산에서 광물을 캐내듯, 세상에 쏟아지는 수많은 데이터 속에서 사람들 마음의 흐름을 캐낸다는 뜻이다. 그간 민간기업의 대표로서 시장(市場) 빅데이터를 주로 분석해오던 그는 지난해 3월부터 서울시 정보기획단장으로 취임해 공공(公共) 빅데이터 분석에도 나섰다.

심야전용 올빼미버스. [사진 서울시 홈페이지]

　그가 속칭 ‘어공’(어쩌다 공무원)이 된 뒤 내놓은 첫 작품은 지난해 9월 운행을 시작한 서울시 심야전용 올빼미버스다. 서울 시내를 9개 노선으로 나눠 자정부터 오전 5시까지 40분 간격으로 45대의 버스를 운행하는 이 서비스는 시작하자마자 하루 평균 6000명이 이용하는 등 시민들로부터 좋은 반응을 얻었다. 지난해 말 서울시민이 뽑은 ‘서울시 10대 뉴스’ 중 1위에 올랐고, 빅데이터를 활용한 모범 사례로 대통령상까지 받았다. 자칫 텅 빈 심야버스 운행으로 지탄받을 수 있는 프로젝트를 성공시킨 비결은 빅데이터 분석이었다. 김 단장은 자정이 넘은 시각에 집주소와는 다른 곳에서 휴대전화를 사용하는 서울시민의 통신 데이터를 분석했다. 사람들이 심야에 어디에 주로 모여있고, 어디로 가길 원하는지를 읽어낸 뒤 이를 바탕으로 버스 노선을 정한 것이다.

　그는 또 다른 ‘대박 상품’을 준비 중이다. 프로젝트명은 ‘택시 매치메이킹(match-making) 서비스’다. 서울 시내 법인택시의 공차율은 약 42%다. 100㎞를 달리면, 40㎞는 빈 차로 다닌다는 얘기다. 서비스가 시작되면 손님을 찾아 거리를 헤매야 하는 택시기사와, 빈 택시를 찾기 위해 발을 동동 구르는 시민들의 간극을 이어줄 수 있다. 공차율이 줄면 택시 기사의 수입도 올라가고, 빈 차로 돌아다니지 않으니 환경오염도 줄일 수 있어 ‘일석사조(一石四鳥)’다.

　김 단장이 주목한 것은 2만 대가 넘는 서울시내 법인택시에 달려있는 디지털타코그래프(DTG)라는 장치다. 승객의 승하차 정보가 들어있는 일종의 블랙박스다. 애초에는 택시 유류보조금 지원을 투명하게 하기 위해 만든 장치다. 김 단장은 DTG의 데이터를 이용해 시간·날씨·계절별로 다양하게 나타나는 택시 승하차 정보를 분석하고 있다. 그는 “택시기사들 사이엔 손님 잘 잡히는 장소는 아무에게도 안 가르쳐 준다는 이야기가 있다”며 “이 시스템을 이용하면 택시 경력 30년의 노하우를 가진 기사보다 더 많은 정보를 알 수 있게 될 것”이라고 말했다. 택시 매치메이킹 프로젝트는 11월까지 작업을 완료하고 내년 1월부터 서비스를 시작할 계획이다.

　빅데이터가 공공 서비스에 활용되는 분야는 교통에만 국한되지 않는다. 최근 분석작업을 끝낸 것 중에는 ‘어르신 여가시설 입지 분석’ 프로젝트도 있다. 65세 이상 노인이 어디에 많이 살고, 주로 어디서 활동하는지를 파악해 이를 바탕으로 지역별 대형 노인복지센터를 세우는 내용이다. 노인이 어느 지역에 많이 사는지는 행정정보로 쉽게 알 수 있다. 김 단장은 여기에 휴대전화 통신 데이터와 노인 시설물 데이터, 신용평가사의 지역별 평균 소득 정보를 더했다. 분석 전까지만 하더라도 마포구가 1순위 후보 지역이었지만, 빅데이터 분석 결과 실제 수요는 강북구와 송파구가 더 많아 최적지로 나타났다. 김 단장은 “버스나 택시·공공시설 모두 한정된 자원으로 시민에게 서비스하는 것”이라며 “과학적인 데이터 분석을 근거로 하면 갈등 없이 효율적으로 자치행정을 펼칠 수 있다”고 말했다.

　김 단장은 연세대에서 컴퓨터공학을 전공했다. 박사 과정에서 기계와 사람 간의 소통을 위해 필요한 ‘자연어 처리’를 연구하다 1997년 같은 과 선배인 이재웅 대표의 권유로 다음커뮤니케이션에 입사했다. 검색 서비스에서 시작한 그는 그 결과로 나타난 수많은 문서를 분석해 트렌드나 호감도 등을 읽어내는 ‘텍스트마이닝(text-mining)’으로 범위를 넓혔다. 그는 2000년 다음에서 독립해 텍스트마이닝 전문회사 ‘다음소프트’를 차렸다. 국내에서 텍스트마이닝이란 개념은 대학에서만 통하던 시절이었다.

　본격적인 텍스트마이닝 사업은 포털·블로그 데이터가 어느 정도 쌓인 2006년부터 시작했다. 주고객은 삼성전자·현대자동차·LG전자 같은 대기업이었다. 첫 작품은 현대자동차 평판 분석 작업이었다. 인터넷 등 각종 온라인 문서에 올라온 현대차 관련 정보를 모아 자동차 전문가나 소비자들이 현대차를 어떻게 생각하는지를 알아냈다. 2007년엔 삼성전자의 의뢰를 받아 인터넷 게시판과 뉴스기사의 댓글·포럼 등에 올라온 글을 분석해 휴대전화 마케팅 전략을 뽑아냈다.

　텍스트마이닝이 본격적으로 뜨기 시작한 것은 2008년부터다. 소셜네트워크서비스(SNS)인 트위터와 미국 애플의 아이폰이 등장한 직후다. 모바일 네트워크를 통해 특정한 날짜 정보를 가진 소셜데이터가 쏟아지면서 분석할 수 있는 대상이 풍부해진 것이다. 그 전까지만 해도 대기업 마케팅을 위한 시장조사는 일반 리서치회사의 몫이었다. 김 단장은 리서치에 의뢰하면 한 달 이상 걸릴 작업을 빅데이터 텍스트마이닝 기법을 이용해 순식간에 해결했다. 인간의 ‘자연어’를 인식하는 컴퓨터가 수십억 건에 이르는 블로그와 트위터 데이터를 분석해 특정 제품에 대한 소비자들의 생각과 호감도를 읽어내는 방식이다.

　그는 “처음에 반신반의하던 기업들이 2010년쯤부터는 마케팅 도구로서 텍스트마이닝을 인정하기 시작했다”며 “이제는 국내 10대 그룹 대표기업과 P&G 같은 외국계 기업 등 14개 업종, 100개 이상의 기업들이 고객이 됐다”고 말했다. 다음소프트처럼 텍스트마이닝을 비롯한 빅데이터 분석을 하는 업체도 10여 개사로 늘어났다. 때마침 박근혜 정부도 공공 빅데이터 분석을 대표 공약 중 하나로 삼았다. 잘나가는 ‘사장님’은 어쩌다 공무원이 됐을까. 그는 “데이터에 대한 욕심 때문”이라고 고백했다.

　“좁은 지역에 1000만 시민이 살고 있고, 휴대전화 이용자 중 80%가 스마트폰을 이용하고, 정보기술(IT)과 연결된 대중교통이 촘촘히 깔려있는 서울시는 빅데이터 분석가 입장에서 너무도 매력적인 도시입니다. 매일매일 생성되는 빅데이터를 분석하면 공익 증진에 기여할 수 있는 것이 상상 이상으로 많습니다. 민간에서 익힌 기법을 바탕으로 효율적인 정책을 수립하는 데 도움이 되고 싶습니다.”

최준호 기자