2013/02/11 17:15

DNA 개인 감식 기술(1) Views by Engineer

  오늘의 한마디('13. 2. 4)에서 나온 논점들 중 여기 적을 만한 것이 더 있다고 생각하여 몇 가지를 모았음.

  당연히 일반인들이 유전자 감식 같이 상당히 전문적일 수 있는 내용에 대해 쉽게 이해하기는 어렵다.  하지만 전문가들이 이런 저런 이유 때문에 일반인들의 생각과 벗어나는 의견을 보일 때, 가능한 여러 정보원(sources of information)들을 이용하지 않고 '그냥 반대'한다면 역시 비논리적이기는 마찬가지라 생각한다.  요즘은 상당히 고급 기술을 요하는 경우라도 많은 경우 상당히 쉽게 풀어 쓴 정보를 찾을 수 있기 때문이다.
  많은 부분은 앞 글에서 언급했지만, 중요한 질문 몇 개에 대해서는 다시 다루고 조금 자료를 보강하겠다.
 

  오해가 없기 위해선, DNA '지문'에서 우리가 사용하는 부분이 무엇인지와 '거기서 무엇을 알 수 있냐'를 정확하게 이해해야 한다.

  1. DNA의 어떤 부분을 사용하는가?

  물론 DNA는 우리 신체를 만드는 모든 정보를 담고 있다.[1]  하지만 DNA의 모든 부분을 다 분석해야 개인 식별을 할 수 있는 것도 아니며, 모든 부분을 다 개인 식별에 쓸 수 있지도 않다.  왜냐하면 특정 유전자가 모든 인간에게 공통된 경우부터 거의 개인마다 다 다른 수준까지 차이가 크기 때문이다.

  소와 강낭콩은(그 밖의 모든 생물도) 히스톤 H4 유전자라는 거의 동일한 유전자를 갖고 있다.  그것의 내용은 306개의 DNA 문자로 이루어져 있다.... 소와 강낭콩은 그 306개의 문자열 중 단지 두 개만 차이가 난다.  소와 강낭콩의 공통 조상이 정확히 얼마나 오래 전에 살고 있었는지는 모른다.  그러나 화석 증거에 의하면 그 시기가 10억 년 전과 20억 년 전 사이일 것이라고 추정할 수 있다...
  영겁을 뛰어넘는 히스톤 유전자의 이러한 보존 능력은 유전자의 수준에서도 예외에 속한다.  다른 유전자들은 높은 비율로 변한다.  아마도 자연선택이 그러한 유전자들의 변화를 히스톤 유전자의 변화보다는 잘 수용하기 때문일 것이다.  예를 들면 피브리노펩티드(섬유 모양의 단백질; 역주)라는 단백질의 암호를 가지고 있는 유전자는 기본 돌연변이율에 거의 육박하는 비율로 변한다.  이러한 사실은 아마도 이들 단백질(이것들은 혈액이 응고할 때 만들어진다)의 세부 구조가 변하는 것이 개체의 생존에 별다른 영향을 미치지 않는다는 것을 의미한다.

- '눈먼 시계공(The blind watchmaker)', Richard Dawkins, 과학세대 역, 민음사 刊, p.179~82

  히스톤 유전자에는 선택압이 크게 작용하므로, 무슨 변화가 일어나기 어렵다.  이렇게 강한 선택압에 노출되는 경우 '정말 기능이 개선되지 않으면'[2] 자연선택은 돌연변이에 의한 변화를 주로 제거한다.

  .. 자연계에서 일어나는 선택은 세대가 지날 때마다 평균값에서 눈에 띄게 변화되는 것보다는 평균값을 유지하려는 방향으로 일어난다고 생각된다.  아주 미약하게라도 어떤 방향성을 지닌 선택이 일어날 경우 그것은 대체로 잘못을 바로잡아 주는 것이다...  그래서 다윈이 진화의 원인이라고 제안한 자연선택 과정이 오늘날에는 주로 진화를 방지하는 작용을 하고 있다고 생각된다.

- 'The pony fish's glow(진화의 미스터리)', George C. Williams, 이명희 역, 두산동아 刊, p.55

  정리하여

  * 어떤 유전자가 소유자의 핵심적 기능을 발현할 정도로 중요하다면, 그들은 대개 거의 비슷하거나 같다.
  * 개인을 식별할 정도로 다양하려면, 기능이 별로 중요하지 않거나 아예 눈에 띄는 기능이 없어야 한다.  

  따라서, 개인 식별 표지(marker)로 유용한 데 필요한 조건 중 하나가 '개체의 기능적 정보를 덜 담고 있어야 한다'는 것이다.  한 마디로 (거의) 쓸데 없는 유전자?  사람들이 상당히 놀란 것 중 하나라면, 인간 게놈 프로젝트에서 밝혀낸 것 중 하나가 인간의 DNA 중 유전 정보로 해독되는 것은 불과 5% 이하(3%라는 말도 있음)란 것이다.  나머지 95% 이상은 '(단백질로) 해독되지 않는다'.[3]  좀 더 설명하자면 '인체에 필요한 단백질을 만드는 데 필요한 정보를 담고 있지 않다'.
  그러면 이런 다양성을 지닌 '정보 없는 DNA 부분'이 실제 개개인을 식별할 만큼 충분한가?  그렇다.  적절한 부분을 충분히 골라 비교하기만 한다면 말이다.

  실험을 통해 잘라낸 '부호화하지 않은 DNA 부분'이 신원확인에 알맞은 이유는 간단하다.  이 부분이 개인마다 다르기 때문이다.  이렇게 다른 DNA 부분은 수백 개가 넘으며, 이는 모두 과학수사를 하는 데 알맞다.  하지만 시간이 흐르면서 우리는 그런 부분들 가운데 20개 정도의 부분들만 모범 기준으로 사용하기로 합의를 보았다.  바로 이 부분들을 얻어내는 실험을 '짧은 연쇄반복(STR)'이라고 부른다.  그 기본단위가 짧은(short) 데다가 계속 반복(repeat)해서 나타나기 때문에 이런 이름이 붙었다. 

- 'Dem Täter auf der Spur(
모든 범죄는 흔적을 남긴다)', Mark Benecke, 김희상 역, 알마 刊, p.217

  우려 하나는 접자.  현재 DNA 수사에서 사용하는 부분은 개인의 건강 등등의 신체적 특성을 파악하는 데 거의 필요가 없는 부분들이다.[4]

  어떤 개인의 DNA 감식 자료를 훔친 흉악범일지라도 그걸 가지고 할 수 있는 일은 아무것도 없다. 그는 그저 당사자를 다른 사람들과 확실하게 구분해주는 바코드를 훔친 것에 지나지 않는다.

- ibid., p.262

  2. 실제 방법

  DNA 분석으로 개인 분별을 할 수 있다는 것은 알았다.  그러면 실제적으로 어떤 문제가 있으며(실패 사례도 이전에 있었다), 범죄 현장에서는 어떤 방법을 동원할까?

  맨 먼저 해야 하는 것은, 당연히 범인과 관련된 DNA source를 찾아야 한다.  다행히도(혹은 관점에 따라 불행히도) 대부분의 범죄 현장에서는 이를 찾기가 아주 쉽다.

  .. 공통점은 아주 작은 조직에서 검출한 유전형질인 DNA를 가지고 그 주인이 누구인지 확인하는 것이다.  이런 방식으로 현장의 단서를 가지고 범인을 추적하며, 친자관계를 살피고, 통조림 안의 고기가 진짜 고래 고기인지 알아내기도 한다.  신체의 어떤 조직이든 DNA를 가지고 있기 때문에 가능한 방법이다.  머리카락, 유산한 태아, 오줌(잘 알려진 예는 도핑 조사다), 우표 뒷면에 말라붙은 침 등과 같은 단서들로 실종자가 누구인지 알아내거나, 시체의 썩은 조직을 가지고 그 신원을 밝혀내는 일은 모두 'DNA 감식'으로 가능하다. 

- ibid., p.185

  그야말로 털 한 조각만으로도 가능하다.  Ole!
  그런데 DNA source를 찾았다고 그게 바로 범인의 것이라고 할 수 없지 않나?  오히려 사람들은 이러한 '소량 단서'는 지나칠 정도로 의도적/비의도적으로 많이 흘리고 다니기 때문이다.  즉, 범죄 현장에서 발견한 여러 털 중 어느 개인의 것이 나왔다고 그게 다 범인의 것이라는 보장은 없다.  보통 감도(sensitivity)가 좋을 경우, 잡음(noise)에도 예민해지기 때문에 '선택성(selectivity)'이 감소하는 것과 같은 이치다.

  범죄사건 수사의 핵심은 현장에 남겨진 흔적이 희생자와 범인에게서 비롯된 것인지 확인하는 일이다... 현장에 남겨진 흔적이 정말 범행을 저지른 사람의 것인지, 아니면 '그럴 만한 근거'가 있는 사람의 것인지 가려볼 방법이 없지 않은가... 이를테면 가족이나 친구는 얼마든지 현장에 흔적을 남길 수 있다.  자동차의 경우에는 그 차를 이용하는 모든 사람을 감안해야 한다...
  일반적으로 혈흔과 같은 범인의 생체 단서는 공격을 자행한 당사자가 범행을 저지르면서 입은 상처에 의해 생겨난다.  떨어져나간 피부 조직이나 머리카락과 같은 흔적을 찾는 일은 혈흔을 찾는 일에 비해 훨씬 더 많은 수고를 요구한다.  그만큼 찾기가 어렵기 때문이다.

- ibid., p.190~91

  이 '선택성 감소'의 문제 때문에, DNA 검사 방법은 범죄 현장처럼 상대적으로 적은 수의 대상자를 샅샅이 뒤지고 들어가는 경우라면 모를까 'big brother'와 같은 전국민 대량 감시 방법으로는 현재 아무 쓸모가 없다.  이에는 다른 이유도 있는데 좀 뒤에서 다시 정리하자.

  그러면 어떻게 아주 극소량의 source에서도 단서를 찾아낼 수 있을 정도로 예민한가?  우선 이런 원칙에 기초한다. 

  유전형질은 우리 봄이 어떻게 구성되어 있는 것인지에 관한 정보를 담고 있다... 하지만 한 사람의 유전자 안에 서로 일치하지 않는('코드가 맞지 않는') DNA 부분들은 있을 수 없다.[5]  서로 맞지 않는 DNA가 함께 모여 한 사람의 몸이나 그 성장과정을 이루어내고 주도할 수는 없기 때문이다.  그러므로 개인 식별은 실험을 통해 DNA를 복제해서 원래 DNA와 서로 차이가 나는 부분을 비교함으로써 이루어진다.  검사를 위해 어느 부분이 차이가 나는지 확인하는 방법을 가지고 그 개인의 성격이나 지능 정도를 알아낼 수는 없다.  게다가 범죄생물학자는 그런 정보를 얻어내고자 하는 게 아니기 때문에 서로 일치하는 않는 부분만을 다룰 뿐 나머지에는 관심조차 갖지 않는다.

- ibid., p.217

  한 마디로 '몸의 모든 세포는 동일한 DNA 정보를 갖고 있다'는 원칙이다.  어느 부분에서 떨어진 세포더라도 DNA 결과는 하나만 나온다는 말이다.

  다음에는 그 높은 민감성, 소량의 시료(sample)에서 부호화하지 않은 DNA의 특정 부분을 정확히 어떻게 비교하는가의 문제다.  우선 DNA 복제의 방법인 PCR부터 설명하면

  사람에 따라 달라지는 가변적인 [DNA] 부분의 길이를 직접 잰다는 것은 무척 까다로운 일이어서 오늘날 실험실에서는 아주 세련된 생화학 기법을 쓴다.  이 기술을 고안해낸 캐리 멀리스(Kary Mullis)는 그 공로를 인정받아 1993년 노벨화학상을 받았다.  핵심은 간단하다.  임의적으로 선택한 DNA 부분을 복제해내는 것이다...
  이런 복사 기법을 우리는 '중합효소연쇄반응(약칭 PCR; polyerase chain reaction)'이라고 부른다... 이 연쇄반응은 사진 복사와는 달리 아주 빠른 시간 안에 무수히 많은 복제를 이룰 수 있게 해준다... 이는 다시 말해서 현장에서 얻어낸 실날같은 단서 하나를 가지고 DNA를 감식하기에 충분한 표본을 얻어낼 수 있음을 의미한다.

- ibid., p.218~19

  국과위의 현대의 과학수사 포스팅에서는 거의 PCR을 사용한다고 소개한다(위키에는 한글로도 소개가 상당히 자세하다).  연관 항목인 DNA fingerprinting에서도 정보를 볼 수 있다.  근데 말은 쉽지만 제대로 하는 것은 상당히 까다로운, 경험자들만 할 수 있는 작업인 모양이다.  난 생물학 전공자가 아니라 알 수 없지만 말이다.



[ 가사 (from here) ]

The PCR Song by Scientists for Better PCR

There was a time when to amplify DNA,
You had to grow tons and tons of tiny cells.
(Oooh) Then along came a guy named Dr. Kary Mullis,
Said you can amplify in vitro just as well.

Just mix your template with a buffer and some primers,
Nucleotides and polymerases too.
Denaturing, annealing, and extending,
Well it’s amazing what heating and cooling and heating will do.

[Chorus]
PCR when you need to detect mutation (detect mutation)
PCR when you need to recombine (recombine)
PCR when you need to find out who the daddy is (who’s your daddy?)
PCR when you need to solve a crime (solve a crime)
[x2]

  ...

  하하, 이 가사만 보면 '참 쉽다'.
  해 본 분들께서는 동의하지 않으시지만 말이다 ㅋㅋㅋㅋ
  어쨌건 이 부분을 잘 했다고 하고, 그 다음 단계는 STR의 길이를 재는 것이다.

  복제된 DNA는 아주 다루기 쉽다.  그 안에 포함된 부분의 길이를 측정하는 데 있어 가장 빠른 방법은 전기영동장치가 달린 DNA 염기서열 분석기를 사용하는 것이다.  아주 간단하게 설명하자면 시액의 일부(예를 들어 3 마이크로리터)를 푸딩과 같은 모양의 폴리아크릴아미드 겔 위에 얹고 전기 자극을 준다.  더 정확하게 이야기하자면 겔의 위쪽 끝은 음전기를, 아래쪽은 양전기를 띤다.  DNA 자체는 음전기를 가지고 있으므로 겔의 아래쪽, 즉 양전기에로 이끌리게 된다.  약 3시간 뒤에 이런 전기영동을 멈춘다.  이제 투명한 모양의 DNA 절편들은 겔 속에서 크기에 따라 분류되어 있을 것이다.  작은 것은 겔의 망과 같은 조직 때문에 그만큼 빨리 걸러져서 아래쪽에 놓이며, 커질수록 망을 통과하는 시간이 더 걸리는 탓에 큰 것은 위에 남는다.
  그런 다음 겔은 흑백사진을 인화할 때와 똑같이 요오드화은(AgI)으로 처리를 한다.  분리된 DNA 절편들은 이제 검은 선이나 '띠'처럼 보인다.  겔에는 길이를 알지 못하는 절편들 외에도 언제나 이미 그 길이를 알고 있는 절편들의 표본을 함께 놓어둔다(표준으로 삼기 위해서임).  이제 알고 있는 것과 모르고 있는 것이 서로 얼마나 차이가 나는지 비교를 한다.  이렇게 하면 그 크기를 확실하게 계산해낼 수 있다.

- ibid., p.219~20
 
  결론만 사진으로 보자.  이렇게 나온다.  위에서 말했듯이, 각 '띠'의 위치 및 강도는 STR로 찾아낸 유전자형을 알려 준다.
  (source; ibid. p.221, copyright Mark Benecke)

  길이가 너무 길어져서 다음 편으로.  쓰다가 편집기 한도 넘어가는 일은 별로...

  漁夫

[1] 정확히 말하면 그렇지는 않다.  보통 'DNA'라 하면 세포핵의 염색체 내 DNA를 생각하는데, 미토콘드리아에도 적긴 하지만 자체의 DNA가 있기 때문이다.  이 미토콘드리아 DNA는 모계 계열을 추적하는 데 아주 요긴하게 사용된다. 
  그러면, 우리가 단순히 세포핵 DNA와 미토콘드리아 DNA의 모든 염기 배열을 알았다고 해 보자.  그러면 시험관 내에서 인간을 만들 수 있나?  당연히 아니다.  이 유전 정보들은 인간으로 발생할 때 특정 환경 아래 있다는 전제에 따라 작동한다 - 더 구체적으로는 난자의 세포질과 자궁 내막이라는 성장 환경 말이다.  현재의 이해 수준으로는 DNA 정보만 갖고 거기서 생긴 사람이 어떠할 것인지 100% 다 예측하기는 불가능하다.

[2] 여기서 따옴표를 쳐 놓았는데, 우리는 보통 '개선'이라면 절대적으로 질이 나아지는 것(e.g. 어느 공장이 같은 품질의 제품을 변화 전에는 하루에 1000개 만들다가 후에는 1100개 만드는 식)을 의미하기 때문이다.  실제로는 반드시 '개선'이 아니더라도 선택받을 수가 있다.  '동등'하거나 심지어는 '열등'하더라도 말이다.

[3] 단백질로 '번역'되어 기능을 발현하지 않는다는 의미에서 '쓰레기 DNA'라 부르는 수가 있는데, 실제로는 '정확히 무슨 기능인지 모른다'는 것이지 '있어 봤자 필요 없는 쓰레기'인지는 모른다.  실제 쓰레기도 있긴 할 것이다.  하지만 이 95%를 모조리 다 없애도 괜찮을지는 아무도 장담을 못 할 것이다.

[4] '거의'라고 적은 것처럼, 완전히 정보가 없는 부분은 아니라고 한다.  사실 일부 인종적 특성들(e.g. 피부색, 머리털 모양 등)도 알아낼 수 있다면 수사에 도움이 많이 될 것이고 일부 연관성을 찾은 사례도 있다.  하지만 별로 일반적이지 못하다고 알려져 있다.

[5] 100% 다 이렇지는 않고 역시 드물지만 예외가 있다.  소위 'mosaicism'이다(link).  다른 예로 이란성 쌍동이 둘이 발생 과정에서 하나로 합쳐져 한 명으로 태어나는 경우도 이에 해당한다(당연히 몸의 부분에 따라 유전자형이 둘이 될 것이다).  하지만 상당히 드물기 때문에 대개는 안심하고 사용할 수 있다.

덧글

  • 디트 2013/02/11 17:25 # 답글

    정말 단순한 PCR-전기영동은 대학교 교양 생물학 실험 수준에서 하니 그 이론 자체는 어렵지 않다고 봅니다.물론 법의학에서 사용되는 레벨이면 어림없겠습니다만;;
  • 漁夫 2013/02/12 11:56 #

    법의학 분석이라고 근본 원리가 크게 다르지는 않습니다. 단, 개인을 문제 없이 정확하게 식별하기 위해서 어떤 것을 제대로 고려해야 하는가에 대한 부분을 크게 확장하고 엄밀하게 다루고 있습니다. 그리고 범죄 현장에 가서 볼 경우 실제 이 기술을 적용하는 데 어떤 문제들이 있는지도 중요하지요.
  • Graphite 2013/02/11 17:46 # 답글

    작년 9월이었던가, ENCODE 프로젝트에 의해서 기존의 junk dna라고 부르던 부위의 대부분(~80%)이 이런저런 생화학적 작용을 통해 유전자 전사/번역 조절에 관계하고 있다는게 밝혀졌습니다.

    Junk DNA라는 용어는 유전학 교과서에서도 잘 안쓰이던데 요즘 추세대로라면 몇년 내로는 아예 사라져 버릴듯 하더군요.
  • 漁夫 2013/02/12 11:56 #

    감사합니다. 포스팅 하나 잽싸게 만들었습니다 (_ _)
  • 효우도 2013/02/11 17:59 # 답글

    5번은 미국 드라마 하우스에서도 나왔죠.
  • kuks 2013/02/11 18:35 #

    미드 CSI에서도 이 때문에 골탕먹는 에피소드가 하나 있었지요.

    제목이 '키메라(Chimera)'였는데 한 사람이 두개의 유전형질을 갖고 있기에 구강상피세포와 정액의 유전자가 달랐고, 피해자의 진술에도 불구하고 풀려나서 다른 범죄를 저지르는 내용이었습니다.
  • 漁夫 2013/02/12 11:58 #

    체세포 mosaicism이 있는 것처럼, 미토콘드리아 DNA의 경우에도 2가지 이상이 존재할 수 있습니다. 분석 및 결과 해석에서 좀 까다로운 점 중 하나지요.
  • 구들장군 2013/02/11 18:40 # 삭제 답글

    어찌보면 별 상관없는 말 같지만,
    일반인들은 사진 하나 있으면 그걸로 '이 사람인지 아닌지' 가려내는 것이 아주 쉽다고 생각하는 일이 많습니다.
    그리고 그 생각이 지문정보/DNA정보 수집에 대한 반대론 밑바닥에 깔려있기도 한 것 같습니다[물론 모두가 그런 것은 아니구요].
    예컨대 '사진으로도 거의 해결되는데 지문/DNA는 뭐하러?'처럼 말이죠.

    그런데 그건 절대 아니더라구요. 실무상 사진이 있어도 식별이 쉽진 않습니다.
    지문도 생각처럼 쉽지만은 않은 것 같더군요,
  • 위장효과 2013/02/11 23:30 #

    사진이라는 객관적 자료만 가지고 따진다면 일반적인 인식도 그닥 틀릴 게 없긴 합니다.

    문제는, 사진이라는 객관적 자료를 가지고서 인간이라는 인식의 주체가 뭔 뻘짓을 할지 아무도 예측못한다는 거...

    과학적 논문보다도 문학작품에서 사람들이 사진과 앞의 인물가지고 뭔 삽질을 하는지 그 메커니즘을 술술 풀어낸 적이 있지요.
  • 漁夫 2013/02/12 12:01 #

    뭐 사진도 앵글이나 조명 등에 따라서 아주 달라 보이기도 하니.... ;-)

    지문도 여러 가지 실제적 난점이 있는데 어떤 분의 경우 손을 쓰는 일을 너무 오래 해서 지문이 아예 사라진 사례가 있다네요.
  • RuBisCO 2013/02/11 19:44 # 답글

    사실 해독이 안되는 부분들이 완전히 의미가 없는 부분들만은 아니고 알고보니 전사에 영향을 미치고 있었다던가 하는 식의 예측하지 못한 영향을 끼치는 경우도 있긴합니다. 덤으로 염기가 어디서 떨어져도 완벽히 같지 않을 수도 있긴 합니다. 이론적으로는요.
  • 漁夫 2013/02/12 12:01 #

    Graphite님 덕에 정보를 추적하여 포스팅 하나 올렸습니다. 그야말로 따끈따끈한 정보네요 ㅎㅎ
  • 오뎅제왕 2013/02/15 00:14 # 삭제 답글

    서던 블롯팅 이나 아가로스 젤 , 공제 혼성화 등의 용어개념은 분자생물학과 PCR 의 기본 이죵,,,,
  • 漁夫 2013/02/16 14:18 #

    네. 근데 '생물학 외'의 사람들에게는 외계어겠지요 ;-)
  • 오뎅제왕 2013/02/15 00:22 # 삭제 답글



    온도 사이클러 라고 불리는 thermal cycler 로 한 30 cycles 돌리면서 denaturation ( dna 가닥을 분리하기 위한 고온 변성 과정) 대략 94°C for 40 s, 그리고 단계 말고 한 단계의 온도 단계가 더 있는데 6~70°C 로 가열해서 프라이머가 새로운 가닥을 신장하는 단계.. 마지막으로 annealing (프라이머 결합을 위한 냉각 과정 ) 대략 50°C for 1 min, and extension at 72°C


    이 과정에 나오는 taq 폴리머레이즈 프라이머 ㅋㅋㅋ

    일반인들은 그저 CCTV 사진 하나면 다 오케이겠지 라고 생각하나 봅니다.
  • 漁夫 2013/02/16 14:18 #

    Taq는 도킨스가 '조상 이야기'에서 언급하기도 했지요. 여기 적을까 하다가 그건 뺐습니다.
댓글 입력 영역
* 비로그인 덧글의 IP 전체보기를 설정한 이글루입니다.


내부 포스팅 검색(by Google)

Loading

이 이글루를 링크한 사람 (화이트)

831

통계 위젯 (화이트)

2434
116
1319222