[빅데이터 본 세상(7) '문재인의 사람' 분석해 보니] 대통령과 상관 관계, 내각은 낮고 청와대는 밀접

중앙일보

입력 2017.06.04 00:02

전통적인 언론 매체 실제 여론 반영하지 못해… 청와대 참모는 선거 전부터 밀접성 높아

문재인 대통령은 5월 10일 오후 청와대 춘추관에서 이낙연 국무총리 후보, 서훈 국가정보원장 후보, 임종석 비서실장에 대한 인선을 직접 발표했다. / 사진제공·뉴시스

문재인 대통령은 5월 10일 오후 청와대 춘추관에서 이낙연 국무총리 후보, 서훈 국가정보원장 후보, 임종석 비서실장에 대한 인선을 직접 발표했다. / 사진제공·뉴시스

5월 10일 오후 문재인 대통령은 청와대 춘추관에서 기자회견을 열고 초대 내각 후보자와 청와대 참모진을 발표했다. 이날 문 대통령은 이낙연 국무총리 후보자, 서훈 국가정보원장 후보자, 임종석 비서실장을 직접 발표했다. 이후 조국 청와대 민정수석, 조현옥 인사수석을 포함해 김상조 공정거래위원장 후보자, 김동연 부총리 겸 기획재정부 장관 후보자, 강경화 외교부 장관 후보자 등의 장관 후보자와 청와대 참모 지명이 이어지고 있다. 언론은 문 대통령의 인사에 대해 다양한 분석을 내놓고 있다. 솔트룩스의 빅데이터 분석 솔루션 데이터믹시를 이용해 ‘문재인의 사람’을 분석했다. 이번에는 상관관계 분석을 이용했다. 문 대통령과 밀접성을 살펴볼 수 있는 방법이다. 분석 결과는 ‘상관계수’로 표시할 수 있다. 상관계수가 1에 가깝다는 것은 문 대통령과 밀접성이 높다고 해석할 수 있다.

5월 10일부터 23일까지 발표된 초대 내각 후보자는 이낙연 국무총리 후보자, 서훈 국가정보원장 후보자, 김상조 공정거래위원장 후보자, 김동연 부총리 겸 기획재정부 장관 내정자, 강경화 외교부 장관 후보자다. 5월 24일 이낙연 후보자를 시작으로 이들의 국회 인사청문회가 계속 열린다.

관계보다 탕평, 지역안배, 능력 우선시

문 대통령과 초대 내각 후보자의 상관계수는 어떨까. 1년 전(2016년 5월~2017년 5월 7일)과 선거 후(5월 9일~24일)로 나눠 살펴봤다. 선거 전과 선거 후로 분석하는 이유는 선거 전후에 따라 각 인사에 대한 언급량 패턴이 크게 변화하기 때문이다. 솔트룩스 이경일 대표는 “선거 전 상관계수가 낮은 인사가 발탁됐다는 것은 문 대통령과 관련이 있던 인사가 아니라고 해석할 수 있다”면서 “탕평이나 지역안배, 능력 등을 우선한 인사라고 볼 수 있다”고 설명했다.

초대 내각 후보자를 선거 전 기간으로 분석한 결과 문 대통령과의 상관계수는 대부분 낮았다. 문 대통령과 별다른 접점이 없었던 것이다. 이낙연 총리 후보자의 상관계수는 0.109214, 서훈 국정원장 후보자는 0.048261으로 매우 낮았다. 그나마 김상조 공정위원장 후보자의 상관계수는 0.28077로 밀접도가 높은 인사로 꼽힌다. 선거 후 기간으로 분석하면 초대 내각 후보자와 문 대통령의 상관계수는 예상대로 높아졌다. 특히 문 대통령이 직접 처음 발표한 인사인 이낙연(0.827174)·서훈(0.814235) 후보의 상관계수는 다른 후보보다 높았다. 김상조·김동연·강경화 후보는 여전히 상관계수가 낮았다. 이렇게 된 이유에 대해 분석을 도와준 솔트룩스 연구원은 “지명된 날짜가 늦었고, 분석 기간이 짧기 때문에 상관계수가 낮은 것”이라고 설명했다.

청와대 참모와 문 대통령의 상관관계는 어떨까. 5월 24일까지 발표된 청와대 참모는 임종석 비서실장, 조국 민정수석, 조현옥 인사수석, 박수현 대변인, 장하성 정책실장, 김광두 국민경제자문회의 부의장 등이다. 초대 내각과 동일하게 선거 전과 선거 후로 비교 분석했다.

문 대통령과 청와대 참모의 상관관계 분석 결과는 초대 내각과 전혀 달랐다. 청와대 참모는 선거 전부터 문 대통령과 밀접성이 높았다. 초대 내각 후보자와 청와대 참모의 인선 기준을 달리했다고 해석할 수 있다. 문 대통령은 청와대 참모진은 자신과 관계가 많았던 이들을 중심으로 임명했음을 알 수 있다. 상관계수가 특히 높았던 인사는 조국(0.459164) 민정수석과 장하성(0.664879) 정책실장이 꼽힌다.

선거 후 상관계수는 대부분 높아졌다. 대통령과의 밀접성이 더욱 높아졌기 때문이다. 이에 반해 상관계수가 떨어진 참모(장하성 정책실장, 김광두 국민경제자문회의 부의장)도 있다. 솔트룩스 관계자는 “두 인사가 가장 늦은 21일에 임명됐기 때문에 문 대통령과의 밀접성이 떨어진 결과가 나온 것 같다”고 설명했다.

언론들은 아직 발표되지 않은 참모와 내각에 대해 각종 하마평을 쏟아내고 있다. 언론에 오르내리고 있는 인사들 중에서 문 대통령과 상관계수가 높거나 낮은 이들은 누구인지 분석해봤다. 기간은 1월 1일부터 5월 8일까지 선거 전으로 한정했다. 상관계수가 높은 인사 5명은 진선민 더불어민주당 의원, 김현철 국민대 특임교수, 송영길 더불어민주당 총괄선대본부장, 유은혜 더불어민주당 의원, 이재정 경기도교육감이 꼽혔다. 상관계수가 가장 낮은 인사 5명으로는 박범계 더불어민주당 의원, 박선원 전 청와대 안보전략비서관, 김상곤 전 경기도교육감, 김현종 전 통상교섭본부장, 윤후덕 더불어민주당 의원이었다.

최영진 기자 cyj73@joongang.co.kr

* 20여 년 동안 인공지능 기반 솔루션 사업을 해온 솔트룩스가 개발한 ‘데이터믹시(DATAMIXI)’를 이용해 빅데이터를 분석했다.

19대 대선, 언론과 여론 간극 컸다 - 후보 언급도, 후반으로 갈수록 홍준표가 안철수 앞서

제19대 대통령 선거는 신문과 방송이라는 기존 언론 매체에 큰 숙제를 남겼다. 바로 신뢰성 회복이다. 이번 대선 기간 동안 전통적인 언론이 국민의 여론을 잘 보여주지 못했다는 비판을 받고 있기 때문이다. 실제로 그런지 빅데이터를 통해 분석해봤다. 결론적으로 유권자의 여론과 언론에서 보여준 여론에 차이가 있었다.

키워드 트렌드 분석을 이용했다. 한 개 또는 다수의 키워드에 대한 기간별 언급량을 비교할 수 있는 분석 방법이다. 문재인·홍준표·안철수를 키워드로 2016년 11월 24일부터 2017년 5월 7일까지 약 6개월간을 대상으로 분석했다. 빅데이터 분석에 사용되는 데이터 소스를 뉴스와 트위터, 블로그로 나눴다. 기존의 언론 매체와 새로운 여론 통로로 이용되는 SNS로 비교하기 위해서다.

데이터 소스를 뉴스로 선택했을 때 제19대 대통령 선거는 줄곧 문재인 후보와 안철수 후보의 ‘양강구도’였다. 투표를 앞둔 시점까지도 전통 언론 매체는 여론과 다르게 보도를 하고 있었던 것. 이에 반해 트위터와 블로그가 보여준 여론은 오히려 선거 결과와 비슷하다. 4월 1일부터 10일까지는 안철수 후보에 대한 언급도는 문재인 후보보다 높았다. 하지만 TV토론이 시작됐던 4월 세 번째 주부터 안 후보의 하락세가 시작됐다. 3번의 TV토론이 끝났던 4월 20일 이후부터 홍준표 후보의 언급량은 안 후보를 추월하기 시작했다. 흔히 말하는 ‘실버 크로스’가 이뤄졌던 것. 이후 이 흐름은 계속됐다. 솔트룩스 이경일 대표는 “전통적인 언론은 안철수 후보에 대해 계속 언급했지만, 실제 여론은 무척 달랐음을 빅데이터 분석을 통해서 알 수 있었다”고 평가했다.

ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT
모비온

Innovation Lab

ADVERTISEMENT