[리뷰] 위험한 숫자들



더퀘스트 출판사의 "위험한 숫자들(사너 블라우 저/노태복 역)"를 읽고 작성한 리뷰입니다.

표지


숫자에 내재된 위험한 요소를 제대로 간파하여 보다 정확하고 객관적인 시각을 갖게 도와주는 양서이다.

숫자에 관한 책인지라 사실 책 내용에 숫자나 시각화 자료가 많이 등장할 것으로 예상했지만 대부분의 내용은 줄 글로 쓰여진 독특한 구성이 신기하다. 하지만 책에 흠뻑 빠져들다보니 숫자책에 숫자가 등장하지 않는 저자의 의도가 이해되기 시작한다.

말은 내뱉는 즉시 강렬한 비판이 따르는 데 반해 숫자는 그렇지 않다. 오히려 진리에 가까운 표현이라는 느낌과 더불어 이에 반할 경우 논리적이지 못한 느낌을 얻게 되기에 숫자는 공개되는대로 맹신받는 편이다.

저자는 글자보다도 오히려 숫자가 생산되기까지 내부에 숨은 의도를 간파할 것에 주의를 기울일 것을 당부한다. 그 때문이었을까? 숫자 편향에 관한 내용을 담고 있는 본문에서도 숫자를 비판하는데 있어 글을 이용했다.

숫자를 사용한 비판을 피한 구성은 저자의 의도였을 것이며 덕분에 독자는 더욱 다양한 수의 양상을 느끼고 즐길 수 있는 기회를 얻게 된 셈이다.

먼저 코로나-19 사망률의 주제를 놓고 트럼프 대통령의 우기기를 비판하며 서문이 시작된다. 트럼프는 미국의 우월한 통계를 위해 사망률의 분모를 전체 인구가 아닌 감염자 수로 바꾼것이 중요한 수치임을 강조한다. 즉, 사망률이 아닌 치명률의 관점을 고수하는 것이다.

이런 서문의 작은 불씨조차 숫자를 바라보는데 의도가 숨어있음을 쉽사리 간파할 수 있다. 더불어 저자 본인이 볼리비아의 현지민과 설문 조사를 실시하는데 있어 스스로의 프레임으로 구성된 몇가지 답안 중에 현지민의 답을 껴맞추고 있음을 돌이켜 반성하며 숫자란 이토록 의도된 자의 프레임에 갇히기 쉽다는 메시지를 전한다.

이탈리아와 네덜란드의 코로나 비교에서는 비교 시작 지점이 달라 비슷한 위험률을 보이는 통계 자료의 허상을 비난하기도 한다. 트럼프는 여기서 또 한 번 비난을 받는데 미국의 감염률 관련 안 좋은 수치를 측정 기술이 뛰어난 공으로 돌리는 정치적인 해석을 저자는 맹비난한다.

그리고 그동안 역사속에 숨어있던 숫자가 있는 그대로가 아닌 의도를 가진 숫자로 대중에게 알려져 왔는지 여러 일화를 분석하며 책의 본문이 시작된다.

예를 들면 나이팅게일의 숫자는 위생 정책 강화를 위해 요긴하게 사용된 무기였다. 통계학과 시각화 진영의 역사에서 늘 단골로 등장하는 나이팅게일 도표가 등장하며 역사적으로 나이팅 게일이 숫자를 어떻게 이용했는지 소개되는데 그동안 세간에 알려지지 않은 이면을 알게되어 흥미로웠다.

숫자는 주로 표준화 - 예를 들면 ISU 국제단위계 방식의 단위 통일 - , 모으기, 분석(이해)의 과정을 거쳐 위력을 갖게 된다. 이 과정에서 경계해야 할 것은 만들어진 숫자들이다.

여키스의 지능검사가 우생학에 악용된 경우가 그러한 케이스이다. IQ와 피부색이 모집단 내에서 상관관계가 있었던 것을 우생학에서 인과관계로 설명하거나 집단 간 비교로 악용하며 민중을 선동했던 안타까운 역사를 맹 비난한다.

GDP도 그러한 것중의 하나이다. 태어나면서 부터 GDP를 배워 온 사람들은 세대가 변하면서 이 지표에 대한 권위에 도전할 마음을 잃게 되는 것 같다. 나 역시도 GDP는 절대적으로 경기 침체여부를 정확히 판단해주는 지표라고 믿고 있었으니 말이다.

하지만 성인이 되어 돈에 대한 공부를 하며 조금씩 의구심을 품게 되었는데 인터넷 강의 같은 경우 복제를 하여 소비되는 개념인데 이런 경우 GDP에는 영향을 미치기 어렵다는 부분이 이해가 가지 않았다.

결국 통렬하게 GDP의 근간을 흔드는 책을 오늘에서야 만나게 되었다. 고작 생긴지 100년 밖에 안되는 미완성에 가까운 지표라는 점임에도 이를 세간에서는 중력과 같은 진리에 가까운 수치로 받아들이고 있음을 경계했다.

GNP 기반으로는 정부의 세수에 의한 생산 행위가 집계되지 않고 공헌으로 보이지 않으므로 이를 포함한 정부측의 의도와 프레임의 관점으로 생성된 지표라는 의미이다.

이런 만들어진 숫자들 그리고 지능의 정의라는 애매모호한 경계선에서 가치판단이 중요하다는 것을 강조하고 있다. 셀 수 있는 것의 여부도 중요한 쟁점 사항으로 보고 있는데 굿하트의 법칙이 소개된다.

측정치가 목표가 될 때 더 이상 좋은 측정치가 아니다.

예를 들면 네덜란드 경찰서에서 벌금을 많이 걷는 것을 실적으로 인정하던 시기가 좋은 예가 된다. 경미하고 사소한 것까지 시민들의 불편을 야기하며 실적을 올리기에 혈안이 된 경찰은 사회에 긍정적인 영향보다는 부정적인 영향을 끼치게 됨은 두말할 나위가 없다.

또한 하나의 수치로 귀결되는 함정도 살펴야 한다. IQ가 그러한 케이스가 되겠다. 각 지능 간의 측정 수치는 동일한 단위와 범주가 아님에도 최종 점수는 의도한 사람들이 보기에 편리한 숫자 하나만 존재한다. 섞일 수 없는 것들이 하나로 섞이는 것은 분명 문제라 할 수 있다.

이어서 그렇게 되길 바라는 측정을 경계해야 한다고 강조한다. 앞서 IQ와 피부색에 대하여 상관관계와 인과관계의 관점에 따라 피부색과 관계가 있을 순 있어도 피부색이 IQ를 유발하는 것은 아니라는 점을 늘 경계해야 하는 요소라 강조하고 있다.

최근 트럼프 당선이 빗나간 사례가 소개되며 여론조사의 한계도 재미있게 서술하고 있다. 프레임이 이미 씌워진 어설픈 질문, 특정집단을 배제한 질문, 너무 작은 표본, 무응답을 고려해야 여론조사의 한계를 제대로 파악할 수 있다. 오차범위가 고려되었다면 트럼프가 당선되어도 전혀 이상할 것이 없었음을 소개한다.

그 외에도 AI 시대의 알고리즘과 재현성, 불확실성 등 재미있는 통계 기반의 숫자 편향 소재들이 등장하여 흥미롭게 읽을 수 있었다. 한바탕 저자의 드라이빙에 재미를 한 껏 느끼면서도 한편으로는 숫자에 대한 그동안의 선입견을 바로 잡을 수 있던 명저라는 생각이 든다.

끝으로 저자가 숫자를 의심하는 연습으로 소개한 체크리스트를 정리하며 리뷰를 마칠까 한다.

  • 전달자가 누구인가?
  • 어떤 감정을 느끼는가?
  • 표준화된 수치인가?
  • 데이터가 어떻게 수집되었는가?
  • 데이터가 어떻게 분석되었는가?
  • 숫자를 어떻게 제시했는가? (평균, 100% 제시, 등급, 위험, 그래프 등)

객관적이고 진리에 가까운 표현이었던 숫자에 숨은 의도와 편향을 보다 객관적으로 바라보는 것은 어쩌면 이 시대를 사는 모든이에게 요구되는 소양이기에 누구나 한 번쯤 이 책을 일독할 것을 권하고 싶다.


YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.






© 2019.04. by theorydb

Powered by theorydb