Opinion :유혁의 데이터이야기

잘못된 질문엔 답이 없다

중앙일보

입력 2020.12.21 00:28

지면보기

종합 25면

유혁 윌로우 데이터 스트래티지 대표

유혁 윌로우 데이터 스트래티지 대표

우수한 성적으로 통계학이나 데이터 마이닝 관련 학위를 취득한 데이터 사이언티스트 지망생들도 현업에 투입되자마자 조직을 위해 직접적이고 금전적인 이득을 내긴 어렵다. 그 이유를 간단히 정리해 보자면 첫째, 현장에서는 교수님들처럼 숙제를 구체적으로 내주는 경우가 드물고 둘째, 테스트 환경과는 달리 실제 데이터는 전혀 깔끔하지 않기 때문이다. 대부분의 데이터베이스는 제대로 정리·분류되어 있지 않고 오류로 가득 차 있으며, “도대체 무엇부터 해야 할 것인가”는 초보자가 대하는 가장 어려운 질문이다.

분석은 논리적 문제 제기부터
데이터 전문가에겐 사업 안목
사용자도 지식과 논리 갖춰야
데이터는 꿰어야 보배인 구슬

구체적으로 무슨 작업을 해야 할지가 불분명하면 많은 분석가들은 그들에게 편한 일부터 한다. 문제는 그들이 쉽게 잘하는 일이 꼭 조직이 필요로 하는 것이 아닐 수도 있다는 것이다. 현업 데이터 프로젝트는 분석가들의 지적 호기심을 넘어 반드시 수익상승, 비용절감, 시간 절약 등 가시적 성과로 이어져야 한다. 유망한 데이터 사이언티스트는 다양한 관점에서 상황을 파악하고 조직 전체의 이득을 고려할 줄 안다. 반면에 “왜 이런 모델을 만들었지”라는 질문을 받고 기술적 용어와 수학적 과정만을 열거하는 사람들은 본질을 놓치기에 십상이다. 모름지기 데이터 사이언티스트는 기술 위주가 아닌 ‘문제 해결’ 중심의 사고를 가져야 한다.

그렇다고 데이터 전문가들이 문제 제기 과정을 전적으로 책임져야 하는 것은 분명히 아니다. 의사결정에 데이터 적용을 일상화하려면 비전문가들도 다음과 같은 태도를 갖출 필요가 있다.

데이터이야기 12/21

데이터이야기 12/21

첫째, 데이터를 심각하게 받아들이라는 것이다. 분석의 결과는 지위 높은 사람들이 간단히 무시해도 되는 단순한 의견이 아니다. 과학적 접근방식이 기업문화의 일부가 되도록 경영진을 포함한 모든 의사결정자들이 의식구조를 바꿔야 한다. 과거에 아무리 직관에 의한 결정이 잘 통했더라도 그것이 앞으로도 일관된 성공으로 이어지긴 어렵다. 반면 데이터의 사용이 일상화된 기업들은 그 문화부터 다르다.

둘째, 데이터 관련 사업을 도모할 때 반드시 목적을 분명히 하고 시작하라는 것이다. 그저 남이 하니까 따라 한다는 식의 접근은 십중팔구 낭패로 이어진다. 목적이 정립되면 그에 따라 분석팀, 기술적 요소, 그리고 데이터의 흐름을 재구성해야 한다. 사업 목적에 따라 사용해야 하는 분석 방법과 데이터의 출처와 형태도 천차만별이기 때문이다. 모든 문제를 일시에 해결해주는 데이터 프로젝트란 애초부터 가능하지 않다. 명확한 데이터 로드맵 없이 일을 시작하는 것은 마치 설계도 없이 건물을 짓겠다는 격이다.

셋째, 머신 러닝을 만사형통의 수단으로 여기며 기계에 전적으로 의존하지 말라는 것이다. 분석가가 확실한 목표를 가지고 작업을 시작해야 하는 것처럼 아무리 AI가 발달해도 그에게 명확한 목적을 부여하는 것은 어디까지나 인간이다. 뭐든 기계에 맡기면 해결이 된다는 태도는 많은 시간과 비용의 낭비를 초래한다. 머신 러닝은 근본적으로 자동화 도구이며, 자동화란 이미 검증된 과정에 적용해야 하는 법이다. 미래에는 맹목적으로 기계에 의존하는 사람들부터 기계에 대체될 것이다.

넷째, 디지털 시대에는 데이터 전문가가 아닌 일반 사용자들도 원하는 것을 논리적으로 표현할 수 있어야 한다. 아무리 기술이 발달해도 비논리적인 질문에는 답이 없다. 게다가 의사결정자가 논리적이지 않으면 제대로 된 분석 결과를 앞에 놓고도 틀린 결론을 내릴 수 있다. 사용자들도 데이터 분석 과정에 대한 기본적인 지식을 갖춰야 하며, 그것은 또 분석가들과 소통하는 데에 큰 도움이 될 것이다.

다섯째, 빅데이터는 요술 방망이가 아니라는 것을 직시하고 현실적인 기대치를 유지하며 지속적인 투자해야 한다. 데이터를 사용했다고 갑자기 매출이 몇 배로 뛰는 경우는 극히 드물다. 데이터 관련 사업은 단계적이고 지속적인 개선을 통해 이루어지는 것이지 단숨에 되는 게 아니다. 고로 작은 성공을 토대로 더 많은 성공 사례를 만든다는 태도로 임해야 한다. 초기에 낭패를 보더라도 포기하지 말고 거기서 얻은 교훈을 바탕으로 다음 단계로 이어 가야 한다.

이 ‘데이터 이야기’ 연재를 마치며 요점을 한마디로 정리하자면 “데이터를 효과적으로 사용하려면 질문부터 제대로 하여 정보사업 목적을 분명히 하고, 분석 기술을 통해 주어진 데이터를 원하는 대답의 형태로 계속 축약하는 데 중점을 두라”는 것이다. 데이터는 꿰어야 보배가 되는 구슬 같은 존재다. 

유혁 윌로우 데이터 스트래티지 대표

Innovation Lab