엎치락뒤치락 정당지지율, '편향' 고려해 접근해야

중앙선데이

입력

업데이트

지면보기

882호 04면

이준웅의 총선 레이더 ⑪ 여론조사와 오차 요인

고백하건대 이렇게 흥미로운 선거는 난생처음이다. 우리 정치가 갈수록 극장용 쇼처럼 변해서 그런지, 내가 늙어 초연함에서 오는 즐거움을 새삼 누리게 돼 그런지 모르겠지만 말이다. 서로 이긴다 진다며 아등바등 노력 중인데 이게 그리 나쁜 일인 것만도 아니라 본다. 엎치락뒤치락한다는 표심을 노려 각자 최선을 다한다면 유권자는 더 많은 선택 요인들을 고려할 수 있기 때문이다. 다만 나는 그 엎치락뒤치락한다는 표심이 진짜인지 묻지 않을 수 없다.

그래픽=남미가 기자 nam.miga@joongang.co.kr

그래픽=남미가 기자 nam.miga@joongang.co.kr

여론조사심의위원회가 제공하는 조사결과를 살펴보자. 지난 19일까지 199개의 전국조사를 담고 있지만, 이 가운데 전화조사 표집정보를 제대로 제시한 조사는 74개이다. 조사 자료를 3회 이상 제공한 조사대행사의 결과를 추리면 결국 69개가 남는다. 이를 이용해서 민주당에 대한 상대적 정당지지율을 베이즈 추정방법을 적용해서 구해보면 그림1과 같다.

그림만 보면 과연 정당지지율은 엎치락뒤치락 중인 것으로 보이며, 50% 수평선을 기점으로 오르락내리락도 했던 것으로 보인다. 참고로 이 그림은 민주당과 국민의힘으로 한정해서 상대 지지율을 구한 것이기에 50%를 기점으로 뒤집어 보면 국민의힘의 상대 지지율을 얻을 수 있다. 그나마 믿을만한 자료를 이용해서 최선을 다해 추정했지만, 역시 다시 묻지 않을 수 없다. 이런 오르내림을 믿을 수 있냐는 것이다.

관련기사

먼저 개별 조사에 내재한 오차 요인들을 고려해야 한다. 표집오차가 그 중 대표적인데 그로 인한 변동성은 그림이 제시한 음영지역으로 나타낼 수 있다. 음영지역인 민주당 지지율의 사후확률 95% 영역을 고려하면 대체로 50% 선에서 크게 벗어나지 않다가 2월 말을 기점으로 하락했으나, 최근 다시 반등 양상을 보인다고 해석할 수 있다.

그리고 ‘조사기관 효과’를 고려해야 한다. 자료는 7개 조사대행사의 결과를 포함하고 있는데 어떤 대행사는 무작위 오차에 가까운 효과를 보였지만, 다른 대행사는 중심경향에서 벗어나 추세를 한 편으로 이끄는 편향처럼 작동했다는 것을 발견할 수 있다. 조사회사 효과를 베이즈 추정으로 구한 결과는 그림2에 있다. 추정된 표심을 기준으로 보면, 여론조사꽃과 엠브레인은 민주당 상대 지지율을 과대평가하는 경향이 있고, 조사대행사 연합인 전국지표조사(NBS)는 과소평가함을 볼 수 있다.

다만 다음 두 가지 해석상 주의가 필요하다. 첫째, 이 분석은 최종 선거결과를 기준으로 삼아 분석한 게 아니기에, 아니 아직은 그럴 수 없기에 과대평가니 과소평가니 하는 표현은 자료의 중심경향에 대한 상대적 표현이라는 것이다. 둘째, 조사대행사가 결과를 많이 제공할수록 모수 추정에 더 많이 기여하게 된다. 그래서 69개 중 22개 결과를 제공한 한국갤럽의 조사가 추정된 모수에 가깝게 나왔다.

총선을 마치면 실제 결과를 기준으로 삼이 이 분석을 할 수 있게 된다. 여기 제시한 조사대행사에 따른 편향은 물론 누가 조사를 발주했는지 ‘의뢰자 효과’도 분석해 볼 수 있고 조사 방법론에 따른 차이도 분석해 볼 수 있다. 이런 분석의 요점은 물론 그냥 재밌으라고 하는 데 있는 게 아니다. 지금 혼란스럽게 엎치락뒤치락하는 여론조사 결과들과 그걸 무분별하게 인용하는 전략적 추임새들이 과연 이렇게 난리법석을 부릴만한 일이었는지 사후적으로 확인해 볼 수 있다는 뜻이다.

이준웅 서울대 언론정보학과 교수

ADVERTISEMENT
ADVERTISEMENT