상관관계와 인과관계
과학 부문 기사를 쭉 읽다보면 “암을 정복할 열쇠”같은 마치 세상의 모든 비밀을 다 풀어버린 듯한 제목의 기사가 무슨 월간지마냥 쏟아져 나옵니다. 물론 그 대부분의 실체는 그렇게 거창한것도 아니고 그저 특정 요소의 유의미한 통계치를 확인했다 수준입니다 (이게 하찮은 것이란 뜻은 아닙니다). 이는 기사를 자극적으로 만들기 위한 술수이기도 하지만, 기본적으로 상관관계와 인과관계의 차이에 무지하기 때문이죠.
심리학 수업을 들으면서 가장 자주 듣는 말중 하나가 correlation ≠ causation입니다. 이게 무슨뜻이냐 하면, 상관관계는 인과관계가 아니라는 내용이죠. 두 변수 a와 b 사이에 의미있는 관계가 있는것처럼 보인다고 해도, 그게 a가 b에 영향을 줘서 증가하는건지, 아니면 제 3의 변수인 c가 a와 b에 영향을 끼쳐서 둘 다 증가하는 건지 단순한 그래프로는 모른다는거죠. 상관관계는 단순히 두 변수 사이의 관계를 나타낸다면, 인과관계는 좀 더 복잡합니다. 한 변수가 다른 변수에게 직접적인 영향을 준다는 근거를 찾아야 하기 때문입니다.
가장 흔한 예시가 있습니다. 아이스크림의 판매량이 증가할 때, 익사자의 수 또한 증가합니다. 이 둘 사이에는 확실한 상관관계가 있습니다. 하지만 누군가가 “아이스크림을 먹었기에 익사했다”라고 주장한다면 아마 대부분의 사람들은 말도 안된다는걸 바로 알겠죠. 왜냐하면 우리는 이미 높은 온도라는 제 3의 변수가 영향을 미친다는것을 알기 때문입니다. 그래서 아이스크림 판매량과 익사자의 수 사이에는 상관관계는 있으나, 인과관계는 없습니다.
이 사실을 숙지하고 난 후에 기사를 읽어보면 새로운 느낌이 날 겁니다. 연구자들은 잘못한게 없어요. 사실 인과관계를 밝히는건 대단히 어려운 일입니다. 그렇기에 학자들은 실험결과에 대해서 조심스럽고, 무언가를 증명했다던지 하는 확신하는 투의 단어를 거의 안씁니다. 특히 사회과학에서 그러한 경향이 크죠. 왜냐하면 자연과학에 비해서 정밀한 실험 설정이 어렵고, 항상 예상치 못한 변수가 존재 가능하기때문에 그렇습니다.
페이스북 댓글