☞어떻게 분석했나
연설문·발언록 등을 문단 단위로 쪼갠 뒤 단어를 추출했다. 이어 컴퓨터 알고리즘을 이용해 비슷한 주제끼리 그룹으로 묶었다. 기계학습(머신러닝)의 하나인 토픽모델링 기법이다. 그 뒤 후보별로 사용한 각 단어의 빈도를 측정했다.
연설문·발언록 등을 문단 단위로 쪼갠 뒤 단어를 추출했다. 이어 컴퓨터 알고리즘을 이용해 비슷한 주제끼리 그룹으로 묶었다. 기계학습(머신러닝)의 하나인 토픽모델링 기법이다. 그 뒤 후보별로 사용한 각 단어의 빈도를 측정했다.
‘큰 정부’ 지향하는 문재인, 생각이 많다
한두 개 집중적으로 언급한 주제가 없는 대신, 대부분의 주제에서 ‘정부’ ‘공공’ 등을 주요 단어로 사용한 게 특징이다. 문 후보 발언 주제 중 가장 큰 비중을 차지한 ‘산업 구조조정’ 분야에서도 ‘정부’ ‘공공’ ‘육성’ 같은 단어가 자주 사용됐다. 지난해 한진해운이 파산하고 올해 들어 대우조선해양이 대규모 공적자금을 수혈받으면서 산업 구조조정이 주요 이슈로 떠올랐다. 문 후보는 이와 관련 정부 지원을 강조해왔다. 지난달 19일 민주노총 경남본부를 찾았을 때도 “해양선박금융공사 자본금을 4조~5조원으로 확대하고 정부가 공공선박 발주를 늘려야 한다”고 말했다.
일자리 분야 발언에서도 ‘정부’ ‘공공부문’ ‘국가’ 같은 단어가 빈출했다. 문 후보는 공공부문 81만개 일자리 창출을 공약했다. 일자리 문제를 기업·시장에 맡기기 보다 정부가 나서 풀겠다는 의지를 보인 것이다. 시장에 적극적으로 개입하는 ‘큰 정부’를 지향하고 있음을 엿볼 수 있는 대목이다.
4차산업혁명에 꽂힌 안철수
문 후보가 ‘백화점 스타일’이라면 안철수 국민의당 후보는 하나에 올인하는 ‘전문점 스타일’이었다. 안 후보의 발언 주제는 문 후보의 절반인 8개 영역에 그쳤다. 그마저도 4차산업혁명 등 미래산업(35.1%)에 집중됐다.
미래산업은 19대 대선의 주요 화두다. 5명의 대선 주자 모두 10대공약에 ‘4차산업혁명’이라는 단어를 사용했을 정도다. 하지만 이 주제를 놓고 안 후보만큼 다양한 단어를 구사한 후보는 없었다. 안 후보가 사용한 단어는 총 384개로, 가장 적은 단어를 사용한 홍준표 자유한국당 후보(36개)와 비교하면 10배 넘게 차이가 났다. 안 후보 다음으로 많은 단어를 사용한 문 후보(306개)와 비교해도 25% 정도 많았다.
안 후보의 미래산업 관련 발언 중에는 '교육' '학제개편' 등이 주요 단어로 포함됐다. 안 후보는 ‘초등 5년-중등 5년-직업교육 2년-대학 4년’으로 구성된 학제 개편을 공약했다. 여러 발언에서 “4차산업혁명을 위해 가장 먼저 고쳐야할 부분은 교육”이라고 강조하기도 했다. 교육 문제도 4차 산업혁명과 함께 이야기하다 보니, 정작 안 후보의 발언 중엔 교육 분야로 따로 묶인 단어가 없었다.
미래산업 다음으로 발언 비중이 높은 분야는 외교·안보(11.1%)였다. 보수층의 지지를 얻기 위한 안 후보의 ‘우클릭’ 행보가 반영된 것으로 보인다. 하지만 사용한 단어는 ‘미국’ ‘중국’ ‘설득’ 등이 고르게 분포해, ‘핵’ ‘미국’ 등을 주로 사용한 홍준표 후보와는 차이가 났다.
홍준표는 외교안보, 유승민은 재벌개혁, 심상정은 복지
노인·서민(14.9%) 관련 발언 비중도 높았다. 김강민 사이람 상무는 “홍 후보의 타겟 유권자는 안보를 중시하는 노년층이다. 홍 후보가 이들을 겨냥한 ‘맞춤형 전략’을 쓰고 있는 것으로 보인다”고 말했다.
외교·안보(10.8%) 분야에서는 ‘미국’ ‘한미동맹’ 같은 단어를 ‘중국’보다 더 비중있게 사용하며, 보수당 후보의 면모를 보였다. 반면 재벌개혁(11.1%) 분야에서는 ‘대기업’ ‘재벌총수’ ‘일감몰아주기’ ‘내부거래’ 등을 비판하며 ‘공정’과 ‘시장’을 주장, 상대적으로 진보적인 성향을 보였다.
유 후보가 가장 비중 있게 언급한 분야는 교육(12.7%)이다. ‘창업’ ‘4차산업혁명’ 등의 단어를 함께 써 안철수 후보와 유사한 패턴을 보였다.
기사=정선언 기자 jung.sunean@joongang.co.kr
그래픽=김하온 기자
[데이터데이트]데이터로 본 대선후보의 뇌구조② 그들의 동상이몽