이게 왜 중요하냐면, 예컨대 컴퓨터가 이런 입력을 했을때 저런 결과를 토해낸다는 것을 관찰하려면 컴퓨터가 어떤 물건이고 컴퓨터로부터 획득하는 모든 정보 중에서 무엇이 의미있고 또 의미가 없는지를 알아야 하기 때문입니다. 컴퓨터 앞에 앉혀놓은 원시인이 컴퓨터 팬 소음을 아무리 열심히 관찰해봤자 의미가 없는 것 아니겠습니까.
정상과학의 단계에 도달하지 못했다면, 더 정밀한 측정과 관찰은 그저 더 많은 노이즈를 의미할 뿐입니다. 이것이 칼 포퍼가 '사실-수집'의 단계라고 부른 그런 단계입니다. 과거에 '박물학'이라는 용어로 싸잡혀 불리던 생물학이 바로 그런 경우죠.
지금 생물학은 정상과학에 가깝습니다. 그래서 어떤 생물학자가 어떤 생물이 이러저렇다고 말하면 진화생물학자가 달라붙어서 "왜" 이러저러한지를 안심하고 연구할 수 있게 되었죠. 그런데 심리학자가 마음의 어떤 부분이 이러저렇다고 말했을때, 우리는 그게 진화심리학적 분석이 가능한 레벨의 관측인지, 때로는 심지어 마음이 이러저러한 게 정말 맞긴 맞는 것인지부터 의심해야 하는 상황인 것이죠.
이 리플에서는 '과학적으로 [심리학에서] 추론 가능한 것은 무엇인가'란 점에서 생각해 볼 만한 것이 많다.
우선 앞 글과 이 리플이 심리학에 대한 얘기에서 나왔음을 고려한다면, 심리학 연구에서 정말 어려운 점이 무엇인가를 이해해야 한다. 지금 생각나는 대표적인 것을 들면
* 심리학의 실험 대상은 무생물처럼 균일성이 없다.
* 어떤 심리학 분야에서 특정 연구로 어떤 사실을 알아냈어도('부품') 이것이 전체적인 심리 현상에서 차지하는 위치를 알기 어렵다('목적' 또는 궁극인).[1]
첫째는 어떤 일관적 현상을 발견하기 위한 '상관성'의 확인이다. 상관성이 인과 관계를 의미하는 것은 아니지만, 적어도 필요 조건은 된다. 상관성이 없는데 인과 관계가 나올 리가 없다. 심리학 연구에서 필요한 상관성은 대체로 p<0.05(우연성일 확률 5% 이하)로 - 이것도 사실 높게 평가한 것이다 - 물리학 등에서 요구하는 5~6 sigma 정도의 엄밀성은 둘째치고[2], 훨씬 실제에 가까운 공학 연구에서 대체로 요구하는 1%(대체로 3 sigma)보다 훨씬 낮다[3]. 대체 사람의 심리를 연구할 때는 왜 이렇게 상관성이 낮은가? Steven Pinker는 '빈 서판(The blank slate)'에서 공학이나 자연과학적 사고방식의 증거 기준으로[4] 인간 행동을 연구하려는 사람들을 좌절시키고도 남는 연구 하나를 알려 준다.
한 사람의 명예는, 존 서얼의 개념으로 이야기하면, 일종의 "사회적 현실"이다. 즉 그것은 모두가 동의하기 때문에 존재하지만, 그렇다고 해서 현실성이 조금이라도 줄어들지는 않는 것은 그것이 권력의 공유와 깊이 관련되어 있기 때문이다. 한 민족의 생활 양식이 변하더라도 명예 문화는 오랫동안 지속될 수 있다. 누구든 먼저 그 문화를 포기하기가 어렵기 때문이다. 가축과 고지 생활이 먼 기억으로 사라진 지금에도 그것을 포기하는 행위 그 자체는 약함과 낮은 지위를 인정하는 것이기 때문이다.
미국 남부에서는 오랫동안 북부에서보다 폭력 발생률이 높았고, 앤드루 잭슨처럼 "명예를 걸고" 남자들끼리 결투하는 전통이 남아 있었다. 니스벳과 코언은 남부의 대부분 지역에 맨 처음 정착한 사람은 스코틀랜드와 아일랜드 출신의 목축민이었던 반면, 북부에는 영국 출신의 농부들이 정착했음을 지적한다. 또한 남부 산악 지대의 개척지에는 오랫동안 법의 손길이 미치지 못했다. 그 결과 남부에서 발전한 명예 문화는 21세기를 맞이한 지금까지도 법과 사회적 관습에 뚜렷이 살아 있다. 남부의 주들은 총기 소유를 거의 규제하지 않고, 공격자나 강도를 만났을 때 먼저 물러나지 않고 총으로 쏘는 것을 허락하고, 부모와 교사의 체벌에 대해 관대하고, 국방 문제에 대해 보다 강경하고, 범죄자를 더 많이 처형한다.
이러한 태도는 "문화"라는 구름 속에 떠 있는 것이 아니라 남부인들 각자의 심리 속에 뚜렷이 존재한다. 니스벳과 코언은 자유주의적 분위기의 미시간 대학에서 위조 심리학 실험을 공고했다. 실험실로 가려면 지원자는 좁은 복도에서 서류를 정리하고 있는 정보원을 밀고 지나가야 했다. 지원자가 정보원을 스치면서 지나가면 정보원은 서류함의 서랍을 세게 닫고는 '병신'이라고 중얼거렸다. 북부 출신의 학생들은 웃고 지나쳤지만, 남부 출신의 학생들은 눈에 띄게 당황하는 모습을 보였다. 남부 학생들의 경우 테스토스테론과 코티솔(스트레스 호르몬) 수치가 높았고 자부심의 수준이 낮게 측정되었다. 그들은 더 세게 악수하고 실험자를 향해 더 지배적으로 행동하는 것으로 이를 보상했고, 실험실에서 나갈 때에는 두 사람이 동시에 지나가지 못할 정도로 좁은 통로를 따라 반대편에서 다가오는 또 다른 정보원에게 길을 양보하지 않았다. 이것은 남부인들이 항상 씩씩거리며 돌아다닌다는 뜻이 아니다. 모욕을 당하지 않은 대조군은 북부 출신의 학생들처럼 냉정하고 침착했다. 그리고 남부인들은 결코 추상적으로 폭력을 인정하는 것이 아니라, 모욕이나 침해로 인해 야기된 폭력만을 인정한다.
- '빈 서판(The blank slate)', Steven Pinker, 김한영 역, 사이언스북스 간, p.573~75
둘째는 '특정 심리현상'이 (부품으로서) 특정 종의 개체의 행동에서 어떤 위치를 차지할 수 있는지 알아낼 수 있는가다. 이것이야말로 기계가 어떤 목적으로 조립되었는가를 밝히는 궁극적 설명인데... 이 포스팅에서 Donald Symons의 설명이 너무 길기 때문에 George Williams의 요약을 제시하자. (아마 여기 오시는 분들 중 진화가 심리를 포함해서 동물들의 행동을 조형하는 가장 큰 힘이란는 말에 반대하실 분은 없으실 테니...)
1) '정상적인' 환경에 속한 모든 구성원들을 대상으로 적절히 작동하는가? 그리고 특정 기능이 설계된 맥락에 의존하여 작동하는가? [ 신뢰성 ]
2) 그 메커니즘이 특정한 적응적 문제를 효과적으로 해결하는가? [ 효율성 ]
3) 그 메커니즘이 적응적인 문제를 해결할 때 유기체로 하여금 큰 비용을 치르도록 강요하지는 않는가? [ 경제성 ]
바꿔 말하면, 적응은 생물학적 메커니즘의 유용성을 설명할 뿐만 아니라, 유용성이 없는(improbable usefulness) 경우도 설명한다(Pinker, 1997). 본질적으로 적응에 관한 가설은 '단지 우연에 의해서는 발생할 수 없는, 믿을 만하고, 효율적이며, 경제적인 설계 모음에 관한 확률적 진술'이다(Tooby & Cosmides, 1992; Williams, 1966).
- 'Evolutionary Psychology(마음의 기원)', David Buss, 김교헌 외 역, 나노미디어, p.34
이렇게 말하면 쉬워 보이지만, 생각보다 어렵다[6]. ㄱㄱ처럼 적응일 가능성이 매우 높아 보이는 행동에서도 진화심리학자들의 의견은 완전히 일치하지 않는다. 그렇다고 이게 안 된다는 얘기는 아니다. 이런 문제를 다루는 방법이 바로 역설계(reverse engineering)다.
- 'How the mind works(마음은 어떻게 작동하는가)', Steven Pinker.
'No two alike(개성의 탄생)', Judith Rich Harris, 동녘사이언스 간, 곽미경 역, p.228에서 재인용

[ source ; http://farfalle1.files.wordpress.com/2011/05/cherry-pit-remover.jpg ]
그러면 이 정도의 지식을 배경으로 shaind님의 리플에 의견을 적자면...
천공테이프 기계든 전자식 컴퓨터건 간에 똑같은 알고리즘을 구동할 수 있지만 일단 그 기계에 대한 지식은 알고리즘에 대한 지식으로 보장되는 게 아니죠. (컴공과_한테_컴퓨터_조립해달라고_하면_안되는_이유.txt)
이게 왜 중요하냐면, 예컨대 컴퓨터가 이런 입력을 했을때 저런 결과를 토해낸다는 것을 관찰하려면 컴퓨터가 어떤 물건이고 컴퓨터로부터 획득하는 모든 정보 중에서 무엇이 의미있고 또 의미가 없는지를 알아야 하기 때문입니다. 컴퓨터 앞에 앉혀놓은 원시인이 컴퓨터 팬 소음을 아무리 열심히 관찰해봤자 의미가 없는 것 아니겠습니까.
알고리즘에 대한 지식에 둘 이상의 층위가 있다는 얘기는 미주에서 했으며[1], 진짜 심층(한 예로 유전자 수준까지)까지 들어가지 않더라도 쉽지 않다는 데는 동의한다. 하지만 첫 문장에서 무엇을 뜻하시는 줄은 알겠는데, 두 번째 문단에 내가 왜 전부 다 동의하지 않는지에 대해서는 조금 더 설명이 필요하다. 위에서 Steven Pinker의 말을 소개했는데, 사실 이것으로는 좀 불충분하다. 그 부분은 Judith Harris가 계속 설명해 준다.
- 'No two alike(개성의 탄생)', Judith Rich Harris, 동녘사이언스 간, 곽미경 역, p.228~29
당연히 이러한 추측은 '관찰'을 근거로 내리며, 인간 마음의 많은 부분은 '고장난 상황'을 면밀하게 관찰하여 얻어낸 것이다. 예를 들면 Simon Baron-Cohen은 자폐증 환자들을 대상으로 인간이 다른 사람의 의중을 읽을 때 작동하는 장치에 대해 많은 것을 알아냈다.[7] 이 때문에 내가 shaind님의 다음 말이 뜻하는 바가 무엇인지 의미는 알겠으나 현재의 시점에서도 그 말이 타당하다고까지 동의하지는 않는다.
정상과학의 단계에 도달하지 못했다면, 더 정밀한 측정과 관찰은 그저 더 많은 노이즈를 의미할 뿐입니다. 이것이 칼 포퍼가 '사실-수집'의 단계라고 부른 그런 단계입니다. 과거에 '박물학'이라는 용어로 싸잡혀 불리던 생물학이 바로 그런 경우죠.
지금 생물학은 정상과학에 가깝습니다. 그래서 어떤 생물학자가 어떤 생물이 이러저렇다고 말하면 진화생물학자가 달라붙어서 "왜" 이러저러한지를 안심하고 연구할 수 있게 되었죠. 그런데 심리학자가 마음의 어떤 부분이 이러저렇다고 말했을때, 우리는 그게 진화심리학적 분석이 가능한 레벨의 관측인지, 때로는 심지어 마음이 이러저러한 게 정말 맞긴 맞는 것인지부터 의심해야 하는 상황인 것이죠.
'더 정밀한 측정과 관찰이 그저 더 많은 노이즈'일 뿐일까? 그렇지 않다. 물론 '가장 낮은 수준까지 알려진' 물리학과 화학만큼 쉽게 되지는 않는다. 하지만 양자역학이 알려지지 않은 19세기의 그 많은 화학 실험이 더 많은 노이즈에 불과했을까? 그리고 다윈 등장 전에 생물학이 모두 노이즈였다는 말인가? 다윈이 위대한 것은 거기서 진짜 노이즈와 의미 있는 것이 혼합된 상황에서 한 줄로 잘 골라내어 자연 선택으로 엮을 수 있었기 때문이지, 이 업적이 선구자들이 해 놓은 고생 전체를 '노이즈'로 만들 리는 없다.
마지막으로 "심리학자가 마음의 어떤 부분이 이러저렇다고 말했을 때, 우리는 그게 진화심리학적 분석이 가능한 레벨의 관측인지, 때로는 심지어 마음이 이러저러한 게 정말 맞긴 맞는 것인지부터 의심해야 하는 상황인 것이죠."에 대해 언급하자.
- "다양한 설명의 층위에서 어디에 위치하는가?" ; 특정 질문이 진화적으로 어떤 의미가 있는지 판단한다면, 위에서 언급했듯이 George Williams의 세 가지 기준 및 Donald Symons가 이를 특정 문제에 적용해 본 사례를 참고하기 바란다.
- "마음이 이러저러한 게 맞는지조차 의심"; 심리학 실험에서 상관성이 왜 그리 낮은지 위에서 설명했다. 아직까지 심리학에서 특정 의견이나 정설이 뒤집히는 경우는 물리학 또는 화학보다 자주 볼 수 있다. 그렇다고 전부 다 의심해야 할 수준이라고 할 수는 없다.
다시 말하고 싶은 것은, 심리학의 연구는 여러 가지 이유 때문에 '증거 기준이 더 낮아 보이는' 것은 사실이다. 그러나 좋건 싫건 현재 우리에게 주어진 자료는 그 뿐이며 거기서 출발할 수밖에 없다. 물론 여기에 대해 불만을 갖고 있는 사람들은 많다.[8] 하지만 (감히 개인적 추측을 덧붙이자면) 아직까지는 여러 문제 때문에 그리 쉽지는 않다고 생각하며, 이는 단지 진화심리학자들이 게을러서 그런 것만은 아니다. 되는 영역에서는 이 논문처럼 모델링 수준까지 하니까 말이다.
漁夫
[1] 물론 이 둘은 특정한 현상을 찾아낸다는 것, 그리고 이것이 진화적으로 어떤 의미를 갖는지의 두 층위에서 고른 것이다. 보통 근접인(proximate cause)과 궁극인(ultimate cause)이라 말하며 자세히는 이 포스팅
당연히 '근접인' 안에서도 여러 층위가 있는데, 예를 들어 이 포스팅에서 말하는 '심리적 특정 현상의 파악' 외에 '특정 심리 현상을 일으킬 때 뇌 어느 부분의 뉴런에서 어떤 신경전달 물질이 나와서 어떻게 다른 부위의 뇌 활동을 일으키고 ~~ '까지 간다면 진짜 '부품의 작동 방식' 수준일 것이다. 여기서도 가장 낮은 수준이라면 특정 유전자가 어떻게 특정 행동을 유도하는가까지 가야 할 것이다.
[2] 정규분포 곡선에서 5 sigma라면, 링크 포스팅에서 보듯이 그런 event가 'noise로' 일어날 확률은 '천만분의 3' 정도다.
[3] Judith Rich Harris가 '개성의 탄생'에서 이렇게 말한다. "심리학 연구에서는 0.50을 넘는 법이 거의 없고 대개는 그에도 훨씬 못 미친다. 공격성이라는 결과변수와 잦은 체벌 같은 환경변수 사이의 상관계수가 0.30만 되어도 발담심리학자들은 쾌재를 부른다(번역본 p.56)." 이 말은, 상관계수 r이 0.30~0.50이란 것. r2이 0.09~0.25란 말인데, 공학에서 상관성 있다고 인정하는 기준이 r2>0.99 (우연 확률 1% 이하)인 것과 비교하면....
[4] 의학도 마찬가지다. 의학에서 요구하는 증거 수준이 어느 정도인지 Hwan님의 이 포스팅에서 볼 수 있다. 진화가 관련된 경우, 이 정도의 증거 기준을 만족할 수 있는 명제가 얼마나 될까? 아니 화석 기록 등은 이 기준으로 보면 증거도 아니다.
[5] 나머지 반은? 당연히 유전. 대체로 유전의 영향은 나이와 함께 올라간다.
[6] 원 포스팅에서 Don Symons의 논의를 참고하라.
[7] 물론 Baron-Cohen이 근접인을 연구하는 생리학자(!)는 아니다.
[8] 이건 물론 내가 아무 근거 없이 떠들 수 없다. 아이추판다님의 글 및 그 전 글을 보면 왜 이 상황이 그리 만족스럽지 못한가 나와 있다.
덧글
과학(자)에 대해서 흔히 하는 비판인 '그들은 측정할 수 없는 것은 없다고 치부한다'라는 비판에 '정밀하게" 또는 "제대로'라는 수식어가 들어간 듯한 내용이네요.
개인 의견은 '측정 불가능해 보여도 대체로 합리적으로 추론할 만한 우회로가 존재한다'는 것입니다. Richard Dawkins도 인정하듯이 많은 경우 과학적 '추론'은 인간이 직접 느낄 수 있는 직관의 범위를 훨씬 능가합니다.
때로는 직접 측정하는 것이 가능하더라도 오히려 더 효율적이지 못한 경우가 종종 있습니다. 저는 기기 분석이 직업인 입장에서 이런 경우를 종종 경험하지요.