[이코노 서가] 통계라는 이름의 거짓말

중앙일보

입력

업데이트

지면보기

경제 04면

얼마 전까지 대통령 선거에서 어느 후보의 대중유세장에 몇 명이 모였느냐가 관심을 끌곤 했다. 그때마다 주최 측과 경찰측 집계 결과는 늘 다르게 나와 곤혹스러웠던 것으로 기억된다.

1995년 여름 '이슬람의 나라'라는 단체가 미국 워싱턴DC에서 '백만인의 행진'이란 집회를 열었다. 주최 측은 1백50만명에서 2백만명 정도 모였다고 선언했다.

집회 장소를 항공사진으로 촬영해 분석한 공원 경찰은 군중 수를 40만명으로 추정했다. 양측의 주장이 맞서자 보스턴대의 사진분석 전문가가 공원 경찰이 찍은 사진을 분석해 83만여명이 모였다고 밝혔다.

같은 사진 자료인데 어떻게 이런 차이가 나타났을까. 보스턴대학팀은 ㎡당 6명이 서 있었던 것으로 분석했다. 가로.세로 40㎝의 넓이에 한 명씩 있었다고 본 것이다.

엘리베이터에 사람이 가득 찼을 때와 비슷한 수준이다. 공원 경찰은 1인당 면적이 그 두 배라고 추정했다. 실제 군중은 경찰이 추정한 것보다도 훨씬 느슨하게 흩어져 있었던 것으로 조사됐다.

통계학적으로는 간단하게 해결될 수 있는 문제다. 그러나 여기서 중요한 것은 실제 군중이 얼마였느냐가 아니었다. 주최 측은 인기도와 영향력을 과시하기 위해 군중 수를 부풀렸고, 경찰의 추정에 대해 편파적이라고 공격했다.

미 델라웨어대의 사회학 교수인 저자는 엉터리 통계가 난무하고, 많은 사람이 이를 무비판적으로 수용하는 현실을 통탄한다. 엉터리 통계는 통계 기술상의 문제 때문에 생기기도 하지만, 의도적인 목적을 가지고 만들어지거나 왜곡되는 경우가 더 많다는 게 저자의 지적이다.

거식증(拒食症)에 대한 통계를 보자. 1980년대 중반 여권 운동가들은 날씬함을 아름다움과 동일시하는 남성 중심의 문화적 기준에 사회적 관심을 이끌어내기 위해 15만명의 미국 여성이 거식증이라고 추정하면서 이로 인해 이들이 죽음에 이를 수도 있다고 경고했다.

그런데 언제부턴가 여권 운동가들은 매년 15만명의 여성이 거식증으로 죽는다고 주장하기 시작했다. 하지만 매년 미국에서는 사망하는 15~44세 여성은 사망원인을 가리지 않고 다 합쳐도 5만5천5백명 정도인 것으로 집계됐다(97년 미국 인구통계국).

통계는 마법이다. 어떤 주장을 펼칠 때 숫자를 들이대면 상대방을 압도할 수 있기 때문이다. 그러나 모든 사회 통계는 태생적인 한계를 지닌다. 통계 작성자 또는 사용자의 의도가 개입되면 위험해질 수도 있다.

이 책은 추측.정의.측정.표본추출 등의 문제로 엉터리 통계가 만들어지는 과정을 구체적 사례를 통해 보여준다. 인터넷에서의 여론이 곧 사회 여론인 양 여겨지는 현 세태를 반박할 수 있는 논리적 근거도 이 책에서 찾을 수 있다.

이세정 기자

ADVERTISEMENT
ADVERTISEMENT