ADVERTISEMENT

AI 채용, 면접 점수보다 표정·손짓·음성이 더 중요할 수도

중앙선데이

입력

지면보기

863호 25면

이준기의 빅데이터

살면서 어떤 주제가 갑자기 뜨는 경우가 있다. 빅데이터라는 것이 그렇다. 2010년께 갑자기 ‘빅데이터는 21세기의 원유다’ ‘앞으로 데이터과학자는 세계에서 가장 매력적인 직업이 될 것이다’라는 예지적 글들이 등장하기 시작했으며, 15년이 거의 지난 지금 그 예언이 모두 사실이 돼 버렸다.

기술 발달 기존에 보지 못한 자료 제공

이준기의 빅데이터

이준기의 빅데이터

빅데이터는 왜 갑자기 등장했으며 그것이 주목받게 된 가장 중요한 포인트는 무엇일까? 빅데이터의 핵심은 데이터를 통한 세계에 대한 색다른 이해이며, 이것이 태어난 가장 중요한 배경은 디지털화다. 우리는 2000년대 이후 상품 구매, 드라마 시청, SNS를 사용한 다른 사람과의 소통, 가전제품의 이용 등 모든 생활의 영역에서 디지털을 경험하게 됐다. 기존의 생활 경험은 흔적이 남지 않는 행동이었지만 디지털로 옮겨 가며 온라인 쇼핑, 채팅, 사물인터넷 등을 통해 데이터라는 흔적을 남기게 됐다. 이렇게 만들어진 데이터는 이제 우리에게 새로운 이해의 창을 제공하고 있다.

데이터를 통해서 세상에 대한 인식을 바꿀 수 있을까? 그렇다. 가장 극적인 예가 지동설과 천동설의 대립이었다. 인류가 생긴 이래 수많은 사람이 하늘의 태양과 달이 뜨고 지는 것을 눈으로 보며 태양과 모든 행성은 우리가 사는 지구를 중심으로 돌고 있다고 생각했다. 하지만 그 생각을 결정적으로 바꾼 것은 갈릴레오의 천체망원경이었다. 천재 과학자였던 갈릴레오는 기존의 망원경을 개량하여 하늘을 관측할 수 있는 천체망원경을 만들었고, 이것으로 인류 최초로 하늘을 관측해 새로운 데이터를 만들어 낼 수 있었다. 그는 천체 관측을 통해 목성의 위성들이 목성 주위를 돌고 있다는 새롭고 중요한 데이터를 찾아냈다. 천동설에 따르면 모든 삼라만상은 지구를 돌고 있어야 하는데, 갈릴레오의 새로운 데이터는 천동설의 오류를 명확하게 보여 줬다.

당연한 이야기이지만, 갈릴레오의 관측과 데이터가 없었다면 태양은 지구를 중심으로 돌고 있었을까? 아니다. 우리가 1000년여 동안, 또한 지금 어떻게 생각하고 있는 것과 상관없이 자연과 사회는 자신의 법칙대로 움직이고 있다. 천동설에서 지동설로의 사고 변환에서 중요한 계기는 천체망원경의 발명이라는 새로운 기술이었고 이 기술은 우리에게 기존에 존재하지 않았던 데이터를 제공했다. 이런 식으로 기술의 발달은 우리에게 보지 못했던 데이터를 관찰하게 할 수 있는 기회를 제공하고, 이것을 통해 우리는 우리를 둘러싼 세계에 대한 이해를 넓힐 수 있다. 지금까지 우리의 생각을 근본적으로 바꿀 만큼의 데이터 생성에 도움을 준 기술은 망원경, 현미경 그리고 지금의 디지털 기술이다.

얼마 전 노벨 물리학상에 아토초 펄스광 개발에 기여한 과학자들이 선정됐다. 1000경분의 1초인 아토초 단위로 물질변화를 측정할 수 있는 기술이다. 전자의 움직임을 관찰하고 그 데이터를 얻음으로써 우리는 전자의 새로운 세계를 탐구할 수 있게 됐다. 마찬가지로 지금 우리가 빅데이터라고 부르는 것은 자연과 사회의 법칙을 디지털화를 통해 나온 데이터로 재해석하는 길을 열어 놓았다.

교수로서 처음 몇 번의 수업을 하고 난 후 이 학생은 성적을 잘 받을 것 같다는 느낌이 오는 학생들이 있다. 하지만 솔직히 고백하건대, 내 예측은 반만 맞았던 것 같다. 최근에는 온라인 강의가 증가함에 따라 학생들이 언제 온라인 강의를 들었는지, 숙제는 언제 제출했는지, 무슨 질문을 올렸는지, 처음에 강의를 어디까지 들었는지 등의 세세한 디지털 정보를 분석할 수 있다. 이런 데이터 분석을 통해 최종 성적을 예측한 최근 논문들을 보면 5등급 성적 분포에서 보통 90% 이상의 정확도를 보인다.

기업에서 가장 중요한 행위 중의 하나는 좋은 인재를 채용하는 일이다. 지금까지 인재 채용에 이용했던 데이터는 이력서와 면접 태도 등이다. 이런 데이터로 충분히 좋은 사람을 선별할 수 있었을 것이라 믿었지만, 최근의 연구 결과는 대부분의 경우에서 면접의 점수와 그 사람의 채용 후 성과 점수 간에 어떠한 상관관계도 찾지 못했음을 보여 주고 있다. 심지어 면접에서 ‘비행기에 들어가는 골프공의 수는?’ 등의 난해한 문제를 출제하는 것으로 유명했던 구글의 인사담당 핵심 임원은 그의 책 『구글의 아침은 자유가 시작된다』에서 공개적으로 이런 종류의 질문은 전혀 도움이 되지 않았고 오직 인터뷰하는 사람이 잘난 척을 하는 것이라고 잘라 말했다. 최근 기업들은 인공지능을 이용해 구직자의 인터뷰 표정, 손짓, 음성의 톤 등을 분석하기 시작했으며, 인터뷰 대상자의 SNS 내용들도 살펴보기 시작했다.

경기 예측 때 인터넷 검색 내용 분석

이 밖에도 빅데이터를 활용할 수 있는 예들은 수없이 많다. 우리가 기존의 데이터에 기반해 판단했던 거의 모든 문제에 대해 빅데이터는 우리에게 새로운 시각을 제공해 준다. 파킨슨병을 진단할 때 지금까지는 주로 인지검사와 MRI 등을 이용해 검진해 왔다. 앞으로는 웨어러블 디바이스나 스마트폰의 걸음걸이에 의한 흔들림 측정을 통해 훨씬 더 빠르게 초기 진단을 할 수 있을 것으로 보인다. 최근 카드사용 내역에 대한 트렌드 분석에선 평소 알지 못했던 재미있는 결과를 볼 수 있다. 신한카드 사용량을 사용한 분석에 따르면 사람들이 가장 많이 웹툰을 구매하는 시간은 흥미롭게도 밤 11시였다. 더현대 등 백화점의 활성화와 더불어 근처의 오래된 순대국, 부대찌개 등의 노포식당 이용률이 오르고 있는데, 가장 많이 참여하는 연령은 예상과 달리 20대였다.

이렇듯 빅데이터는 누구에게나 큰 기회로 다가오고 있다. 이런 데이터를 통해 세계관을 통째로 바꿀 수도 있지만 현재 갖고 있던 데이터에 조금만 더 설명력만 높여도 경쟁에서 큰 우위를 만들어 나갈 수 있다. 빅데이터 분석에서는 이것을 약한 신호라고 부르는데 대부분의 경쟁자가 모두 같은 강한 신호를 갖고 분석을 할 때 나만의 약한 신호를 더해 예측률을 조금만 올려도 시장에서 선두에 나설 수 있는 것을 의미한다. 예를 들어, 남들이 재무제표를 보면서 기업의 부도 예측을 하고 있을 때 남이 생각하지 못하던 SNS상의 소비자 댓글, 인터넷의 채용 정보를 모델에 첨가할 수 있다. 경기를 예측할 때에도 모두들 소비자 물가지수나 신규 고용 등의 변수를 보고 분기별로 예측할 때 구글 검색 내용과 기업의 전기 사용량 등의 실시간 데이터를 분석해 경기 예측의 정확도를 높일 수 있다.

과거에는 우리가 관찰할 수 있는 정보의 양이 제한적이어서, 세상을 이해하는 데 있어 주관적인 경험이나 직관에 의존할 수밖에 없었다. 하지만 디지털화에 의한 빅데이터 시대의 도래는 지금까지 갖지 못했던 우리 주변에서 발생하는 거의 모든 데이터를 수집하고 분석할 수 있게 됐다. 이는 기존의 사고방식을 뒤엎고, 새로운 관점에서 세상을 바라볼 수 있는 기회를 제공한다.

따라서 빅데이터 시대에는 단순히 데이터를 잘 분석하는 사람보다는, 새로운 통찰력을 제공할 수 있는 데이터를 찾아낼 수 있고 문제에 적용할 수 있는 능력이 있는 사람에게 큰 기회가 될 것이다. 빅데이터를 활용해 세상을 바라보는 새로운 시각을 키우고, 창의적인 사고와 문제 해결 능력을 함양한다면, 빅데이터 시대를 주도하는 주역이 될 수 있을 것이다.

이준기 연세대 정보대학원 교수. 서울대에서 계산통계학과를 졸업 후, 카네기멜론대 사회심리학 석사, 남가주대 경영학 박사를 받았다. 국가 공공데이터 전략위원회에서 국무총리와 함께 민간 공동위원장을 맡고 있으며 『AI 로 경영하라』 『오픈콜라보레이션』 『웹2.0과 비즈니스 전략』 등을 펴냈다.

ADVERTISEMENT
ADVERTISEMENT