ADVERTISEMENT

부패 → 사드, 좌파 → 서민, 미래 → 계파패권 … 강조어가 변했다

중앙일보

입력

지면보기

종합 03면

전국의 유세 현장에서 문재인 더불어민주당 후보는 ‘부패 기득권 세력’, 홍준표 자유한국당 후보는 ‘문재인 후보’, 안철수 국민의당 후보는 ‘계파 패권주의’를 가장 많이 언급한 것으로 나타났다.

‘유세 때 가장 많이 한 말’ 분석 #문, 1강 굳어지자 대결보다 안보로 #홍, 문재인 비판서 감성적 호소로 #안, 지지율 하락 뒤 ‘문 패권’ 공격 #선거 판도 따라 중점 둔 말 바뀌어

중앙일보와 데이터 저널리즘 기관인 서울대 폴랩(pollab)의 한규섭 교수팀이 공식 선거운동이 시작된 지난달 17일부터 이달 4일까지 세 후보의 공식 유세문 46만여 개 글자를 분석한 결과다. 특히 선거운동 초반(4월 17~22일), 중반(23~28일), 후반(29일~5월 4일)으로 시기를 나눠 세 후보가 쓴 단어를 비교한 결과, 시기별 선거 판도에 따라 특정 단어의 이용 빈도가 달라졌다. 이하 ( ) 안의 숫자는 사용 횟수.

유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

◆문재인, 심판에서 안보로=문 후보가 유세 중 가장 많이 사용한 단어는 ‘부패 기득권 세력’(35), ‘사드 배치’(31), ‘국민통합 대통령’(30)이었다. 시기별로 편차가 컸다. ‘부패 기득권 세력’은 초·중반 빈도수 1위를 기록하다 후반엔 14위로 떨어졌다. 또한 초·중반에 여러차례 언급했던 ‘정경유착’(15), ‘정권연장’(14)은 후반엔 한 번도 거론되지 않았다.

반면 후반엔 ‘사드(THAAD·고고도미사일방어 체계) 배치’(31)의 빈도가 가장 높았고, ‘정상회담’(23), ‘색깔론’(14), ‘북핵위기’(12) 등 안보 관련 단어가 크게 늘어났다. 한규섭 교수는 “정권 심판과 관련된 단어의 빈도가 높았던 문 후보는 1강 2중 구도로 바뀌자 대결성 어휘를 줄이고 안정적인 국정 운영에 방점을 뒀다”고 분석했다.

유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

◆홍준표, 보혁 대결에서 서민 부각으로=홍 후보가 가장 많이 언급한 말은 ‘문재인 후보’였다. 무려 156회였다. 시기별로는 초기(78), 중기(52), 후기(26)에 차이가 있었으나 꾸준히 입에 올린 표현이었다. 이 밖에 ‘여론조사’(108), ‘좌파 정권’(100), ‘강단과 결기’(80), ‘종북좌파’(74), ‘강성 귀족노조’(72), ‘핵시설’(72)도 사용 빈도가 상위권이었다.

큰 틀에선 보수와 진보의 이념 대결로 끌고 가려는 전략이었지만 홍 후보도 시기별 변화가 있었다. 지난달 29일 이후 가장 많이 쓴 단어 1, 2위는 ‘경비원 아들도 대통령’(35)과 ‘서민 자녀’(32)였다. ‘문재인 후보’(26), ‘종북좌파’(19)는 줄었다. 초기에 ‘문재인=좌파’를 반복하며 지지층 결집에 주력하다, 후반으로 가면서 감성적인 수사(修辭)를 곁들이며 중도 확장에도 나선 것이라는 분석이다.

유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

유세문 분석은 개별 단어보다 자주 붙어다니는 두세 개의 단어를 묶어 하나의 ‘키워드’로 분석하는 ‘엔그램(N-gram)’ 방식을 토대로 했다. 자료 : 데이터 저널리즘 기관 서울대 폴랩(pollab)의 한규섭 교수팀

◆안철수, 강점 부각하다 공격 전환=안 후보가 가장 많이 언급한 단어는 ‘계파 패권주의’(60), ‘기득권’(40), ‘국민을 적폐’(33), ‘4차 산업혁명’(33), ‘글로벌 혁신 국가’(24) 등이었다. 선거운동 초반 안 후보 유세엔 대결형 단어가 많이 등장하지 않았다. ‘대한민국의 미래’(15) 같은 단어를 많이 썼다.

하지만 중반부터 달라져 ‘계파 패권주의’ 등을 사용하는 빈도가 급격히 증가했다. 안 후보가 양강 구도를 형성하고 있던 시기엔 ‘자강론’에 바탕을 둔 채 자신의 강점 부각에 치중했지만, 지지율 하락 추세를 보이자 친문 패권주의를 강조하는 공격형 유세로 전환했기 때문이다.

◆세 후보 키워드는=유세문 ‘의미망 분석’(Semantic Network Analysis)도 실시해 ‘연결 중앙성’(centrality)를 따져봤다. 연결 중앙성이란 단순한 등장 빈도가 아니라 다른 어휘들과 어떤식으로 관계를 맺는지를 통해 특정 단어의 실질적 가치를 보여주는 지표다. 분석 결과 문 후보는 ‘정권’(0.272), ‘교체’(0.255), 홍 후보는 ‘북한’(0.210), ‘서민’(0.207), 안 후보는 ‘미래’(0.386), ‘개혁’(0.183)의 연결 중앙성이 높았다.

최민우 기자 minwoo@joongang.co.kr

ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT
ADVERTISEMENT