오피니언 과학으로 세상보기

통계를 알면 세상이 보여요

중앙일보

입력

업데이트

지면보기

종합 26면

필자의 초등학교 시절, 교실 뒤의 한 벽은 으레 '새마을 운동'란이었다. 학급 환경 미화를 할 때면 새마을 운동의 효과를 극적으로 보이기 위해 1960년대의 농촌 사진과 새마을운동 후의 사진을 함께 붙여놓았다. 그때 어린 마음에도 이건 공정한 게임이 아니라는 생각이 들었다. 60년대는 조그만 흑백 사진으로, 새마을운동 후는 총천연 컬러의 큰 사진으로 대비시켰기 때문이다. 아마 똑같은 농촌 모습을 조그만 흑백 사진과 큰 컬러 사진으로 대비시켜도 장족의 발전을 이루었다는 착각을 불러일으킬 것이다. 뜬금없이 새마을운동 이야기를 하는 이유는 통계 수치나 그래프가 컬러 사진과 같은 상승 효과를 가져올 수 있기 때문이다.

얼마 전 이공계 신입생의 등록률이 몇년 만에 반등했다는 기사와 함께 지난해와 올해의 등록률을 막대그래프로 제시했다. 대부분의 독자는 수치를 구체적으로 확인하기보다 시각화된 그래프를 먼저 보는 경향이 있다. 지난해에 비해 올해 등록률을 나타내는 막대의 길이가 꽤 길어졌기에, 이제 이공계 기피 현상에서 벗어났다는 안도감을 갖게 된다. 그러나 잘 살펴보면 등록률의 변화에 비해 그래프에서 막대의 길이 변화가 강조돼 있음을 알 수 있다. 물론 요즘과 같이 이공계 기피가 국가적인 우려로 등장한 마당에 등록률의 상승은 분명 반가운 현상이다. 따라서 이 그래프는 '유쾌한' 왜곡에 해당하지만, 여전히 왜곡은 왜곡이다.

또 다른 기사에 따르면 최근 초등학교의 남초(男超) 현상이 완화되고 있다고 한다. 초등학교 입학생 성비가 2000년에 남아 10명당 여아 8.73명으로 심한 불균형을 보였으나, 이를 최저점으로 계속 증가해 2004년에는 10명당 9.2명에 이른다. 이를 나타낸 꺾은선그래프는 상당히 과장돼 2000년부터 2004년까지 가파르게 증가하고 있다. 8.73에서 9.2 정도로 변화한 것을 그래프로 나타낼 때 대개는 세로축을 0부터 시작하지 않고 적당히 생략한 후 '물결선'을 그려 넣는다. 그런데 이 기사의 그래프와 같이 의당 표시돼야 할 물결선이 생략된 경우를 자주 보게 된다.

예전에 비타민을 정기적으로 복용하는 사람의 평균 수명이 길다는 연구가 있었다. 이를 읽고 대부분의 사람은 비타민을 복용하면 오래 살 수 있다는 '인과관계'로 받아들이는 경향이 있다. 물론 비타민과 평균 수명 사이에 의학적인 원인-결과 관계가 성립하지만, 이 명제가 논리적으로 뜻하는 바는 비타민과 평균 수명 사이의 상관관계다. 비타민을 챙겨 먹는 사람은 건강에 대해 관심을 기울이는 부류이므로 운동이나 건강 보조식품의 섭취를 병행할 가능성이 크고, 그 결과로 오래 살 수도 있다. 그러므로 통계와 관련된 주장을 대할 때에는 상관관계가 반드시 인과관계를 뜻하지는 않음을 염두에 둘 필요가 있다.

두 퍼센트 사이의 차이를 말하는 '퍼센트 포인트'에도 함정이 숨어 있다. 통계청 자료에 따르면 2002년과 2003년의 실업률은 각각 3.1%와 3.4%다. 이 변화는 '실업률이 0.3%포인트(p) 증가했다'고 표현할 수도 있고 3.1%에서 상승분 0.3%가 차지하는 비율이 약 10%이므로 '실업률이 10% 증가했다'고 표현할 수도 있다. 동일한 현상에 대한 두 문장이 주는 어감의 차이는 크다. 어떻게 기술하느냐에 따라 천국과 지옥 사이를 왔다 갔다 하게 된다.

세상에는 '거짓말' '새빨간 거짓말', 그리고 '통계'의 세 가지 거짓말이 있다고 한다. 통계학 자체야 타당성과 객관성을 지닌 엄밀한 학문이지만, 그래프와 수치를 써 통계 결과를 나타내거나 그 결과를 대표하는 제목을 뽑을 때 주장하고 싶은 바를 의도적으로 드러내는 자의성이 개입될 수 있기 때문이다. 통계는 '현대 사회를 살아가는 열쇠'라고 일컬어진다. 잘못된 열쇠를 갖지 않으려면 통계 결과에 대해 비판적인 안목과 경각심이 필요하다. 특히 불순한 의도의 왜곡을 경계하기 위해서는 말이다.

박경미 홍익대 교수.수학교육