본문 바로가기
책을 읽고

숫자에 기만당하지 않는 통계적 사고법. 책 "넘버스, 숫자가 당신을 지배한다."를 읽고.

by 은빛연어 2011. 5. 11.

 자신의 주장에 대한 근거를 제시하고 상대방을 설득하거나 이해 시키려면, 많이 알려져 있는 인물의 주장이나 말을 인용하거나, 통계자료나 숫자를 인용하면 주장의 설득력이 높아진다. 인용된 주장이나 말의 사실 여부를 떠나 인용된 인물이 가지는 명성이나 권위 만으로도 듣는 사람으로 하여금 믿음과 설득력을 가지게 만든다. 숫자도 그런 역할을 하는데, 보통의 사람들은 숫자가 틀리든 정확하든 따지기 보다는 숫자가 제시된 것 만으로도 객관성이 있는 것으로 인식하기 때문이다. 깐깐한 사람들은 차근차근 검증하면서 사실을 확인하겠지만, 많은 사람들은 비판적으로 받아들이기 보다는 말하는 사람의 주장을 그대로 믿어 버린다. 

 그 때문에 선량한 사람들을 잘못된 정보로 기만하거나 속이려는 경우가 많이 발생한다. 유명인의 말을 인용해 선량이를 속이려는 경우는 대표적으로 진화론과 창조론의 논쟁에서 볼 수 있다. 창조론자 중에 다윈도 죽기 전에 진화론을 부정하고 창조론을 인정했다고 말하는 사람이 있다. 다윈의 임종을 지켜 본  한 수녀가 직접 들었다면서 퍼트린 말인데, 임종을 지켜본 다윈의 친딸은 다윈은 그런 말을 한 적이 없다고 수녀의 주장을 부인했다. 그럼에도 잘못 퍼진 이 말은 아직도 선량한 사람들을 쉽게 속아 넘어갈 정도로 생명력이 질기다. 

 통계자료나 숫자의 경우는 좀 더 교묘하다. 사실의 여부를 확인하기 위해서 전문적인 지식이 필요한 경우가 많다보니 선량한 사람들이 쉽게 검증을 할 수가 없다. 가장 많이 선량한 시민들을 속이는 대표적인 통계자료가 여론조사라는 것이다. 질문의 문구나 문항의 수에 따라서 조사 결과가 달라지기 때문에 조사를 하기 위해서는 세밀한 과정이 필요하다. 집전화로 하느냐 휴대전화로 하느냐에 따라서도 결과에 큰 오차가 발생한다. 시험문제가 4지선다형인지 5지 선다형인지에 따라서 난이도가 조금씩 달라지듯, 여론조사의 방식이 4점 척도냐 5점 척도냐에 따라서 결과는 또 달라진다. 

 그래서 여론조사 결과를 발표 할 때 신빙성을 확보하기 위해서 조사 문구는 물론 조사방식 등을 상세하게 공개해야 하는데, 우리나라에서는 단순히 결과 만을 발표하는 경우가 많다. 선량한 다수의 사람들은 전문지식이 부족해서 어떤 문항을 가지고 어떻게 조사가 이루어졌는지 따져가면서 여론조사 내용을 보지 못한다. 단지 발표된 숫자가 사실이나 진실이라고 쉽게 단정해 버린다. 문제는 그 이후에 발생하는데, 여론조사 결과와 현실의 괴리가 체감적으로 느껴지면 선량한 사람들은 여론조사 자체를 불신해 버린다. 그래서 최근에는 여론조사 결과와 선거의 결과가 다르게 나오는 경우가 많다 보니 여론 조사 무용론까지 등장하고 있는 상황이다. 

 통계와 여론 조사 등이 보여주는 숫자는 실제로는 과학이다. 전문가들은 이것을 부정하지 않는다. 하지만, 거기에는 "잘 만들어 진"이라는 한 가지 전제가 붙는다. 개인의 사리사욕이 조사에 들어가지 않고, 중립적인 입장에서 과학적 원칙에 따라서 만들면 그렇다는 것이다. 하지만, 인간은 정치적 동물이다 보니 자신의 정치적 입장 때문에 조사나 숫자에 객관성을 확보하려 하기 보다는 개인의 이득을 위해서 움직이는 경향이 크다. 그러다 보니 과학인 통계나 여론 조사가 보여주는 숫자가 사실을 반영하지 못하고 있고, 이로 인해 불신을 받는다. 

 하지만, 그런 자료들을 무조건 불신 한다면 우리는 많은 정보를 놓치게 마련이다. 산업 통계학자 조지 박스는 "모든 모델은 오류를 안고 있지만 일부는 쓸모가 있다."라고 했다. 기만적인 숫자놀음에 속은 선량한 시민들의 분노는 충분히 이해하지만, 우리는 숫자나 자료에 담고 있는 쓸모 있는 일부를 찾아내고 이해할 수 있어야 한다. 그래서 우리에게는 전문가 수준까지는 아니더라도 주어진 자료와 숫자를 비판적으로 분석할 능력이 필요하다. 책 "넘버스"는 통계에 대한 간과하기 쉬운 분석방법과 통계적 사고법을 보여준다. 전문적 지식이 아니라 실제 사례를 통해서 어떤 함정이 있으며 어떤 방식으로 통계와 숫자를 접해야 하는지 제시해 준다.

 그를 통해서 저자는 5가지 통계적 사고법을 보여준다. 첫째, "변이성에 대해서 질문을 던져라."고 말한다. " 평균화는 다양성을 짓밟고, 무엇이든 가장 단순무식한 개념으로 축소시켜 버린다. 이 과정에서 우리는 평균을 앞세워서 다양성을 무시하거나 회피하는 과대단순화의 위험에 빠지게 된다."라고 주장하는 저자는 "통계적 사고는 변이성을 인식하고 이를 이해하는 데에서 시작된다." 말한다. 둘째, "오류 속에서 쓸모 있는 것들을 골라내라."고 한다. 앞에서 인용한 조지 박스의 말처럼 일부에서 활용할 수 있는 중요한 증거물을 찾을 수 있기 때문이라고 한다. 셋째, "언제나 비슷한 것끼리 비교하라."라고 한다. "집단 간 격차 문제는 통계적 사고의 기반이다. 이 문제의 핵심은 어떤 집단을 합쳐야 하고 어떤 집단은 합치면 안되는가에 대한 문제와 관계가 있다. 이 딜레마를 해결하려면 그룹 간 격차를 조사해야 한다."라고 저자는 주장한다. 

 넷째, "두 가지 오류의 타협점에 주의하라."라고 한다. 오류는 시소 같아서 한쪽 오류를 줄이면 다른 쪽 오류가 커지기 때문에 타협점을 찾지 않으면 무시했던 오류가 오히려 과대해져서 문제가 되기 때문이다. 다섯째, "너무 희박한 가능성을 믿지마라."라고 한다. "통계적 사고는 분명 과학적 방법의 중심에 놓여 있으며, 시험할 수 있는 가설을 만들어 낼 이론을 필요로" 하는데 희박한 가능성은 가설을 만들어낼 이론을 충분히 뒷받침 할 수 없기 때문이다. 희박한 가능성을 믿으면 시간 낭비일 경향이 강하고 오히려 다른 가설이나 이론을 만들 기회를 놓치게 되기 때문이다. 

 저자가 제시한 이런 방법들을 터득하면 "매일 매일 어떤 결정을 내릴 때 숫자를 이용하는 법을 터득한다면 당신은 당신의 세상을 지배하게 될 것이다!"라는 책의 마지막 문장처럼 될지 확신할 수는 없다. 방법이라는 것이 조금 추상적이다 보니 익히고 활용하는데 어려움이 있을 것 같은 생각이 들기 때문이다. 하지만, 적어도 선량한 사람들을 속이려는 숫자놀음에 대해서 적어도 비판적으로 생각할 수 있는 도구는 되지 않을까. 

넘버스, 숫자가 당신을 지배한다 - 8점
카이저 펑 지음, 황덕창 옮김/타임북스