ADVERTISEMENT

'숨은 표'는 없다, 다만 실패한 여론조사가 있을 뿐

중앙선데이

입력

업데이트

지면보기

878호 04면

이준웅의 총선 레이더 ⑦ 숨은 유권자 논쟁

언제부터인가 여론조사 결과가 애매하면 ‘숨은 표’가 있다고 말한다. 여론조사 결과가 실망스러운 쪽에서 주로 이런 식으로 말한다. 말만 들어보면 여론조사로 잡을 수 없는 어떤 신비로운 유권자 집단이 별도로 존재하는데, 그러다가 선거일에 툭 나올 것만 같다. 결론부터 말하자면 그런 표란 없다. 숨은 유권자란 없다. 다만 실패한 여론조사가 있을 뿐이다.

우리나라에서 ‘숨은 표’ 논란이 본격적으로 시작한 때는 2000년 제16대 총선이다. 당시 집권연합인 새천년민주당(더불어민주당 전신)과 자민련은 남북정상회담 추진과 같은 정권 차원의 정책 드라이브에 힘입어 과반 의석을 달성하겠다고 기염을 토했다. 그러나 결과는 반대였다. 보수 야당인 한나라당(국민의힘 전신)이 안전하게 원내 제1당을 유지했다.

그래픽=이정권 기자 gaga@joongang.co.kr

그래픽=이정권 기자 gaga@joongang.co.kr

당시 지상파 방송사는 80여 선거구에서 출구조사를 수행했다. KBS는 21개 지역에서, MBC는 23개 지역에서 예측오류를 범했는데 그 오류가 무작위 오차가 아닌 체계적 편향의 패턴을 보이면서 파국을 맞았다. 대체로 한나라당 후보가 당선된 지역구를 거꾸로 예측했던 것이다. 이 결과를 보면서 나온 말이 이른바 ‘숨은 보수’다.

이 말이 유행하는 데 나도 어쩐지 기여한 것만 같아 민망하다. 2000년 예측실패를 보고, 1992년 영국 총선에서 나온 ‘부끄러운 보수당 지지자’(shy Tory factor)란 가설을 도입해서 소개했기 때문이다. 이 가설은 노동자 출신임에도 불구하고 보수당을 지지하는 유권자들이 있는데, 그들이 여론조사에서 지지정당을 밝히기를 꺼린다는 관찰에서 나왔다.

그러나 이 관찰의 요점은 무슨 알 수 없는 종류의 유권자 집단이 어디에 은밀하게 숨어있다가 나온다는 게 아니다. 문제는 여론조사 대행사가 특정 지지자 집단을 차별적으로 과소 또는 과대 표집하거나, 접촉하거나, 응답을 구해서 선거결과를 편향적으로 봤다는 데 있다. 조사비용의 부담이나 연구 역량의 한계 때문에 후보 및 정당 지지율에 영향을 미칠 수 있는 변수들이 한 편으로 기울어져 작동하는 것을 미처 알아채지 못해서 범하는 오류를 경계해야 한다는 뜻이다.

적색과 남색으로 표현한 두 투표자 집단으로 이루어진 모집단(A)이 있다고 가정하자.〈그래픽 참조〉 이 모집단에 접근할 수 있는 전화번호 표집틀(B)을 잘 규정해서, 통신사 안심번호를 사용해서 무작위 표본(C)까지 잘 뽑았다고 하자. 이렇게 하더라도 휴대전화 번호만 사용하는 경우에 연금생활자의 전화번호가 상대적으로 적게 뽑힐 수 있고 그렇지 않더라도 통화시간대가 한낮이라서 직장생활을 하는 젊은 유권자와 통화가 이루어지지 않을 수 있다.

어쨌든 약 2만 개의 안심번호를 사용해서 1000명의 전화조사 응답자(D)를 확보했다고 하자. 이 가운데 투표를 하지 않겠다고 확언하는 응답자를 추려놓고 나머지 투표예정자(E)의 후보 지지율을 구해야 한다. 투표예정자 중에도 ‘누구를 지지할지 모르겠다’고 말하는 이들이 있기 마련이다. 이들의 마음까지 헤아려 지지율을 계산하면 모집단(A)을 추정하는 예측 지지율(F)을 얻을 수 있다.

숨은 유권자란 없다는 말은 위에 제시한 과정 중에 특정 후보자 정당을 지지하는 데 영향을 미치는 ‘비무작위 교란 요인’이 개입하지 않도록 조심해야 한다는 뜻이다. 실제 여론조사에서 A부터 F까지 단계를 거치는 가운데 일부 유권자 집단을 누락한다거나 특별한 요인을 고려하지 못한다 하더라도 상관없다. 그것이 체계적 편향의 원인으로 작동하지 않는다면 말이다.

2016년 미국 대통령 선거예측이 실패한 이유로 저학력 백인 유권자 집단을 접촉하지 못해서 그랬다는 진단이 있다. 예상 투표자를 걸러내면서 특정 인종에 대한 가중치가 과장되어 힐러리 클린턴의 지지율을 과대평가했다는 반성도 있다. 펜실베이니아·위스콘신·미시간 등 지역에서 선거 막판에 지지 유보자들의 표심이 트럼프 쪽으로 쏠리는 현상을 간과했다는 관찰도 유명하다. 그런데 이들은 모두 사후적으로 확인가능한 가설들이며 따라서 향후 대처 가능한 원인들이다. 아직도 해결되지 않은 사안은 학력· 인종·지역으로 가중치를 주어 보정하더라도 남는 백인 유권자의 트럼프 지지이다. 선거 결과를 보기 전까지 알 수 없었던 편향요인이다.

이준웅 서울대 언론정보학과 교수

ADVERTISEMENT
ADVERTISEMENT