길안내 빅데이터 분석 <하> 한국인 일상
“내비게이션이 ‘아직도 2차선이야. 3차선으로 가세요’라고 안내하면 멋지지 않을까요.”
‘카카오 모빌’ 데이터랩장 유승일 박사 #갑자기 방문 몰리는 ‘핫스팟’ 주목 #사람들 생활·욕망의 변화 알려줘 #최적 차선까지 안내 방법 연구 중
카카오내비·카카오택시 등의 서비스를 운영하는 카카오 모빌리티 데이터랩장 유승일(33·사진) 박사가 말하는 길안내의 미래다.
유 박사는 인공지능(AI)의 한 분야인 머신러닝 전문가다. 2014년부터 4년 간 구글 리서치(현 구글 AI)에서 소프트웨어 엔지니어로 일하다 지난 2월 카카오 모빌리티에 합류했다. 유 박사를 지난 18일 경기 성남시 판교 본사에서 만났다.
- 카카오 길안내 데이터가 교통량에 관한 공공데이터와 어떤 차이가 있나.
- “고속도로에 드문드문 설치된 적외선 속도 센서로 측정하는 속도보다 GPS 기반의 내비게이션 데이터가 정확할 수밖에 없다. 하지만 GPS 데이터에도 노이즈가 많다. 예를 들어 휴게소에서 많은 차량이 서 있으면, 휴게소 옆길에선 차들이 시속 100㎞로 달리고 있어도 평균 속도가 떨어진다. ‘맵 매칭(map matching)’ 기술로 두 가지 흐름이 합산되지 않도록 데이터를 처리한다.”
- 방대한 데이터를 어떻게 관리·가공하나.
- “전국의 모든 도로를 몇 미터 단위 600만 개 정도로 잘라서 구간별 속도를 1분 정도의 시간마다 업데이트한다. 속도 센서는 그 지점에서의 속도만 알 수 있지만 우리는 경로별 속도를 파악할 수 있다. 누적된 데이터를 AI 기반의 예측 모델로 처리해 미래의 소요 시간을 예측한다. ‘내일 아침 8시에 출발하면 평창까지 얼마나 걸릴까’를 미리 알려줄 수 있다.”
- 내비게이션 데이터의 핵심은.
- “POI(Point of Interest: 목적지 상호명) 데이터다. 코엑스에 가려는 사람은 내비에 ‘코엑스’라고 찍지 ‘강남구 삼성동 영동대로 513’이라는 주소나 위도·경도를 입력하진 않는다. 빠르게 변화하는 한국 사회에서 목적지 상호명을 얼마나 빠르고 정확하게 업데이트하느냐가 길안내의 경쟁력을 좌우한다.”
- 핫스팟 분석의 의미는.
- “길안내 건수로는 전국에서 사람이 몰리는 인천국제공항이 항상 1등일 수밖에 없다. 우리는 특정한 시점에 갑자기 길안내 건수가 증가하는 지점(핫스팟)들에 주목한다. 언제 왜 특정 장소에 사람이 몰리는지에서 사람들의 생활과 욕망을 읽을 수 있다. 지도 검색과 달리 실제 이동 여부를 알 수 있기 때문이다. 찾아본 맛집과 가본 맛집 정보의 가치는 질적으로 다르다.”
- 이용자들의 성향이 데이터 성격에 영향을 미칠 것 같다.
- “주말에 이용자가 집중되는 게 가장 큰 한계다. 많은 사람들이 주기적으로 이용해야 데이터가 정확해질 수 있기 때문이다. 길 안내 도중 휴대전화가 오는 등의 이유로 도착 전에 안내를 종료하는 경우도 많다. 하지만 처음에 목적지를 찍어 예측 경로를 알기 때문에 소요 시간 등을 파악하는 데 문제는 없다. 길안내를 무시하고 자기 원하는 길로만 다니는 사람들의 ‘경로 이탈’도 유의미한 수준으로 누적되면 새로운 경로가 된다. 통계적으로 내비의 안내를 따른 사용자들의 이동 시간이 짧았다.”
- 길안내의 미래는.
- “나는 운전을 잘 못해 큰 길을 선호하지만 운전을 잘하는 아버지는 좁아도 빠른 길을 선호한다. 이런 개인의 취향까지 반영되면 보다 만족도 높은 추천 경로를 제시할 수 있을 것 같다. 어떤 도로를 어떤 속도로 달리고 있는지는 알 수 있지만 아직 몇 차선에서 달리는지는 알 수 없다. 차선별 이동 속도와 이용자의 현재 차선을 확인해 최적 차선을 안내하는 방법을 연구중이다.”
탐사보도팀=임장혁·박민제·이유정 기자
김나윤 인턴(성신여대 화학4) deeper@joongang.co.kr