ADVERTISEMENT

[책과 지식] ‘빅 데이터’ 읽으면 대선 결과를 알 수 있다

중앙일보

입력

업데이트

지면보기

종합 30면

여기에 당신의 욕망이 보인다
송길영 지음, 쌤앤파커스
284쪽, 1만5000원

“적절한 지렛대와 받침대만 있다면 지구도 움직일 수 있다.”

 고대 그리스 수학자 아르키메데스의 말이다. 21세기 정보화 사회에선 “데이터만 준다면 트렌드를 읽고, 시장을 움직여주마”로 바꿔야 마땅하다. 국내의 손꼽히는 데이터 분석가이자 다음소프트 부사장이 쓴 이 책의 핵심은 이렇게 읽힌다.

 근거는 ‘빅 데이터’ 분석이다. 마음(mind)을 캐는(mining) 작업이라 불리는 데이터 마이닝을 소개하는 책은 이미 여럿 나왔다. 이 책은 거기서 한 걸음 더 나아갔다. 무엇보다 사례가 풍부하고, 또 시의적절하다. 금방 써 먹을 수 있는 얘기가 많다.

 ‘빅 데이터’는 기존의 방법으로 분석하기에 너무 큰 데이터를 뜻한다. 주로 트위터·페이스북 등 소셜 미디어를 통해 입수한 자료다. 대한민국 국민 중 3000만 명이 스마트폰을 사용하며 2012년 현재 한국에서만 하루 500만 여건의 트윗이 올라온다. 지구촌 사람들 9명 중 한 명은 페이스북을 한다. 이를 통해 드러나는 소비자, 유권자의 마음만 읽을 수 있다면 시장을 읽고, 유권자를 움직이는 것은 일도 아니다. 그러니 마케팅 종사자, 선거 참모 등에겐 노다지라 할 수 있다.

 빅 데이터 분석은 ‘전체’를, ‘실시간’으로, ‘진짜’를 보여준다는 점에서 사회를 읽는 탁월한 바로미터라 할 수 있다. 지은이의 경험을 소개한 유유제약 사례를 보자.

 유유제약은 멍든 데, 부은 데, 벌레 물린 데 바르는 베노플러스란 연고를 출시하면서 빅 데이터 분석에 기댔다. 벌레 물린 데 바르는 연고나 붓기 빼는 파스는 이미 판매 중이었기에 경쟁제품을 정하기 위해서였다. 26억 건(2600건이 아니다!)의 소셜 미디어 자료를 분석한 결과 엉뚱한 경쟁자가 나타났다.

 첫째가 계란, 둘째가 쇠고기였다. 소비자들이 멍 치료연고가 있다는 인식은 못하고, 이런 민간요법에 의지하고 있다는 사실이 드러났다. 또 있다. 멍 때문에 고심하는 여성의 시장이 어린이 시장의 네 배나 된다는 사실도 파악됐다. 여성들은 다이어트 때문에 영양상태가 나빠져 쉽게 멍이 드는 반면 지금까지는 이를 파운데이션으로 가리거나 긴 바지로 감추는 데 그쳐서였다.

 이 같은 분석을 바탕으로 베노플러스는 포장박스를 예쁘게 만들고 파우치에 담아 ‘상비약’으로 만들어 팔았다. 어린이에서 미용을 고민하는 성인 여성으로, 치료에서 미용으로 타깃을 바꾸고 효용을 확대한 결과 판매는 성공적이었다.

 이 같은 효과는 빅 데이터 분석의 장점에서 나온다. 우선 자연어 처리 기술을 핵심으로 엄청난 소셜 데이터를 분석하기에 사람들이 일상을 다각도로 통째로 볼 수 있다. 베테랑이나 전문가가 ‘감’으로 내리는 결론은 물론, 샘플링을 통해 극히 일부의 표본조사에 의한 분석과는 차원을 달리한다.

 여기에 솔직한 마음을 파악할 수 있다는 장점이 더해진다. 기존의 설문조사는 질문 방식에 따라 결과가 달라질 수 있고, 무엇보다 수동적 답변을 받기에 소비자 마음을 제대로 담아내지 못하는 경우도 적지 않았다. 자발적으로, 그리고 무의식적으로 오가는 소셜 데이터를 분석하는 ‘빅 데이터’분석은 이런 우려를 덜어낸다. 더군다나 이런 분석이 거의 실시간으로 가능하기에 빅 데이터 분석은 사회를 읽는 혁신적 방안이라고 지은이는 주장한다.

 이것은 정치에도 쓰인다. 사회경제학자 존 캐스티에 따르면 사회적 분위기, 사회적 기분에 따르면 정권이 바뀐다고 한다. SNS에 오른 기분에 대한 표현, 예컨대 ‘짜증나’‘행복해’ 등을 분석한 결과 2011년 서울시장 보궐선거 전 6개월간 들쭉날쭉하며 기분 그래프가 하강국면을 보였다고 한다.

 그러면서 “대통령 선거 결과를 알고 싶다면 선거 1~2주 전에 코스피지수를 보면 된다. 지수가 올라가면 여당이 이기고, 떨어지면 야당이 승리할 가능성이 높다”는 분석을 소개한다.

 물론 빅 데이터 분석이 만능은 아니다. 그리고 그 본질이 데이터 처리기술이 아니다. 지은이는 정말 중요한 것은 무엇이 문제인지 아는 것이라 강조한다. 그리고 이를 바탕으로 기왕의 예상답안이나 모범답안을 버리고 제대로 된 질문을 하는 것이 중요하다고 한다. 그러면서 우리는 문제 자체를 파악하기보다 주어진 문제를 어떻게 빨리 푸느냐에만 관심을 기울인다고 경계하면서 ‘무엇’보다 ‘왜’에 초점을 맞추라 조언한다.

 언뜻 마케팅· 광고업 종사자나 정치인을 대상으로 빅 데이터 분석의 성과와 방법을 알리는 책으로 읽힌다. 하지만 빅 데이터 분석가를 꿈꾸는 학생들과 빅 데이터 도입을 고려하는 CEO들을 위한 제안을 담은 3부 ‘흐름을 읽어 가능성을 찾다’를 보면 타깃이 확장된다.

 2012년 5월 미국 경제전문지 ‘포브스’가 유망직업 10개를 선정, 발표했는데 여기 데이터 마이너(정보수집 분석가)와 CLO(Chief Listening Officer)가 있었다. CLO는 소셜미디어를 통해 고객의 목소리를 듣는 업무를 총괄하는 직종이다.

 뿐만 아니다. 뉴욕타임스는 올 2월 미국에서만 14만~19만 명의 심층분석가가 필요하다고 보도했다. 수학 좋아하는 사람은 지금부터라도 열심히 준비해서 뛰어들라고 권했다. 기업은 재교육을 하든 신규채용을 하든 150만 명의 ‘데이터를 해석하고 쓸 수 있는 사람들’을 확보해야 할 것이라 전망했다.

 인문학도들에게도 반가운 소식이 있다. 데이터 분석을 하려면 언어학자와 전산학자뿐 아니라 인문학자의 지식도 필요하단다. 실제 지은이가 근무하는 다음소프트에는 IT전문가가 70%, 인문사회과학 전문가가 30%를 차지한다고 한다. 데이터에 담긴 함축적이고 중의적인 의미를 풀어내려면 창의적인 인문학 지식이 있어야 하기 때문이란다.

 “높이 나는 새가 멀리 본다.”

 리처드 바크의 『갈매기의 꿈』에 나오는 이야기다. 어쩌면 우리는 이 책에서‘빅 데이터’ 분석이란, 새로운 지평을 바라볼 수 있는 ‘날개’를 만나고 있는지 모른다. 그 날개를 달면 이 시대 사람의 소망을, 나아가 꿈을 읽을 수 있다는 것이다. 

김성희 북 칼럼니스트

ADVERTISEMENT
ADVERTISEMENT