“인간 지놈의 대부분은 쓰레기, 기능하는 부분은 최대 25%”

중앙선데이

입력

업데이트

지면보기

542호 27면

[조현욱의 빅 히스토리] 정크 DNA

DNA의 모습을 묘사한 이미지. 인간의 유전자는 46개의 염색체에 모두 들어있지만 대부분의 DNA는 기능이 없는 쓰레기로 추정된다 [사진 PIXABAY]

DNA의 모습을 묘사한 이미지. 인간의 유전자는 46개의 염색체에 모두 들어있지만 대부분의 DNA는 기능이 없는 쓰레기로 추정된다 [사진 PIXABAY]

2000년 일단락된 인간지놈프로젝트의 로고

2000년 일단락된 인간지놈프로젝트의 로고

2000년 인간지놈프로젝트의 초안이 발표됐다. 염색체에 들어 있는 DNA의 염기 서열 30억 개가 모두 해독된 것이다. 이 가운데 단백질을 코딩하는 부분, 즉 유전자는 1.5%에 불과한 것으로 드러났다.(오늘날 유전자는 좀 더 의미를 넓혀서 ‘하나의 기능을 수행하게 지시하는 단위로서의  DNA  사슬’로 정의된다). 언론은 나머지 98.5%를 ‘정크(쓰레기) DNA’라고 불렀다.

진화 생물학자 댄 그라우어 주장 #“나머지는 쓰레기 DNA로 용도 없다” #인간 유전자는 2만1000개 불과 #ENCODE 프로젝트 분석에선 #“76%는 RNA로 복사돼 기능성 지녀”

이 용어는 1960년대부터 유명해지기 시작했다. 그 성질을 명시적으로 처음 논의한 것은 1972년이었다. 유전체 생물학자 데이비드 커밍스가 단백질을 코딩하지 않는 모든 DNA를 통틀어 지칭한 것이다. 1980년 프랜시스 크릭과 레슬리 오르겔은 네이처의 리뷰 논문에서 “분명한 역할이 거의 없으며 유기체에 자연선택에 따른 이득을 거의 혹은 전혀 주지 않는다”고 정의했다. “지놈 안에 이기적인 DNA 서열이 존재하는 건 숙주의 몸속에 아주 해롭지는 않은 기생충이 들어 있는 것과 비교될 만하다”는 것이다. 오늘날은  뚜렷한 기능이 확인되지 않은 지놈의 염기서열을 지칭하는 의미로 쓰인다.

전이인자가 지놈의 40% 이상 차지

지놈의 40% 이상을 차지하는 것은 전이인자였다. 유전체 내에서 자신의 위치를 옮기거나 심지어 다른 곳에 복사하기까지 하는 DNA 조각을 말한다. 이것이 자신을 스스로 복제하는 비율이 정크 DNA의 양에 주된 영향을 미치는 것으로 짐작된다. 또한 바이러스가 자신의 유전정보를 인체의 생식세포에 복사해 놓은 염기서열도 5%가 넘는 것으로 나타났다. 당시는 이들 염기 서열이 실제로 어떤 기능을 하는지는 모르는 상태였다.

지놈프로젝트의 후속으로  2003년 시작된 것이 엔코드(ENCODE), 즉 ‘DNA요소 백과사전(ENCyclopedia Of Dna Elements)’ 프로젝트다. 유전자의 구조나 형태, 프로모터 부위에 대한 분석을 포함하여 DNA가 감고 있는 히스톤 단백질의 구조 분석, DNA 스위치를 켜고 끄는 메틸화의 패턴, DNA 칩을 통한 전사체 분석 등을 망라한다. 그 결과는 2012년 9월 네이처 등에 무더기로 실렸다.

이에 따르면 인간의 유전자 갯수는 2만 1000개에 지나지 않는다. 또한 전체 DNA의 76%는 RNA로 전사(복사)되며 이를 포함해 80% 이상이 어떤 형태로든 기능성을 가진다. 또한 지놈의 거의 절반이 유전을 조절하는 단백질에 어떤 방식으로든 접근성을 가지고 있었다. 그동안 무의미하다고 생각했던 염기서열의 상당부분에서 기능을 찾은 것이다. 연구자들은 앞으로 데이터가 더 쌓이면 지놈에서 쓰레기로 치부됐던 영역의 존재 이유가 더욱 분명히 드러날 것으로 내다봤다. 사이언스는 같은 달 ‘엔코드 프로젝트, 정크DNA에 대해 조사(弔詞)를 쓰다(ENCODE Project Writes Eulogy For Junk DNA)’라는 기사를 실었다.

이 같은 주장은 특히 진화를 부정하고 싶어하는 창조론자들에게 인기가 높았다. 신이 설계한 지놈이 대부분 쓰레기로 채워져 있다는 그동안의 설명은 불편했기 때문이다.

오늘날 지놈에서 단백질을 코딩하지 않는 영역은 수많은 기능을 하는 것으로 확인되고 있다. 아미노산을 운반하거나 리보솜을 구성하는 RNA로 전사된다. 유전자의 발현 시기를 조절하며 후성유전에도 영향을 끼친다. 배아로부터 성장기까지의 발달, 암의 발병이나 C형 간염에 취약한 정도, 어떤 환경에서 진화한 구조가 다른 환경에서 다른 용도로 활용되는 굴절적응도 이에 해당한다. 이제까지 알려지지 않았던 역할이 점점 더 많이 드러나는 것이다.

그러나 지놈의 80%가 기능을 가진다는 대목에 대해서는 꾸준히 반론이 제기돼 왔다. “인간의 지놈에서 실제로 기능을 하는 부분은 10~15%로 추정된다. 그 상한선은 25%를 넘지 못한다. 나머지는 쓰레기(정크) DNA로서 실질적인 용도가 없다.” 미국 휴스턴 대학의 진화 생물학자 댄 그라우어의 주장이다. 지난달 ‘지놈 생물학과 진화(Genome Biology and Evolution)’에 발표된 논문을 보자.

남성의 염색체 사진 [미국립인간지놈연구소]

남성의 염색체 사진 [미국립인간지놈연구소]

그의 주장은 이렇다. ENCODE는 예컨대 DNA가 RNA로 전사(복사)되는 등의 활동을 보여 주면 기능적이라고 보았다. 하지만 하나의 염기서열이 기능적이라고 말하려면 뭔가 유용한 일을 하도록 진화했어야 한다. 또한 이를 방해하는 돌연변이는 해를 끼쳐야 한다.

우리가 번식할 때 자녀들은 돌연변이가 뒤섞인 덩어리를 물려받는다. 특히 해로운 것들을 물려받으면 성인이 되기 전에 사망할 가능성이 크다. 진화는 이런 방식으로 어느 종에서 해로운 돌연변이가 위험한 수준으로 쌓이는 것을 막는다.

만일 우리의 DNA 대부분이 기능을 하고 있다면 우리에게는 중요한 염기 서열에 해로운 돌연변이를 많이 가지고 있어야 할 것이다. 그렇지 않고 대부분이 쓰레기라면 돌연변이의 거의 전부는 아무런 효과를 내지 못할 것이다.

그는 해로운 돌연변이의 발생 비율과 대체 출산율을 비교하는 간단한 방법을 썼다. 지놈의 크기와 유해 돌연변이 발생률, 인구수에 대한 역사적 자료는 이미 나와 있다. 그라우어는 ‘유해한 돌연변이로 인한 번식 성공률의 감소’를 계산하는 모델을 개발했다.

세대별로 각각의 부모는 평균 2명을 약간 넘는 자식을 두어야 인구수를 일정하게 유지할 수 있다. 유해한 돌연변이 때문이다. 지난 20만 년간 이 같은 대체 번식율은 커플당 2.1~3.0 명을 기록했다. 세계 인구수는 19세기가 시작될 때까지 매우 안정적인 상태를 유지했다.

만일 2012년 ENCODE 팀의 발표대로 80%의 지놈이 기능을 한다면 어떻게 될까. 부부가 평균 15명을 출산하고 이중 13명이 성인이 되기 전에 죽었어야 한다. 25%가 기능을 한다 해도 커플당 4명 가까운 자녀를 낳아 2명만 살아남아야 한다. 그래야 해로운 돌연변이가 위험한 수준으로 축적되는 것을 막을 수 있을 것이란 말이다.

이 같은 추정은 인간의 지놈을 다른 종과 비교한 진화학적 연구결과와도 잘 맞아떨어진다. 2014년 7월 옥스포드대 연구팀이 ‘PLOS Genetics’에 게재한 논문을 보자. 연구팀은 어떤 활동이 중요하고 중요하지 않은지를 가려내는 진화의 선택압을 이용했다. 포유동물이 진화해 온 지난 1억 년간 우리의 지놈 중 얼마나 많은 부분이 스스로에 변화가 축적되는 것을 피할 수 있었는지를 확인한 것이다. 이는 해당 DNA가 중요하다는 사실을 분명하게 나타낸다. 보존되어야 할 중요한 기능을 뭔가 갖고 있다는 뜻이기 때문이다.

이들의 아이디어는 포유동물의 유전체 내의 어느 부위에서 DNA 덩어리들의 삽입과 삭제가 일어나는지를 살펴보는 것이었다. 이런 현상은 염기 서열에서 거의 무작위적으로 일어날 것으로 예상할 수 있다. 만일 자연선택이 기능성 DNA를 보존하는 방향으로 작용하지 않는다면 말이다.

연구팀은 말한다. “우리의 결론은 인간 유전체 중 기능을 가진 것은 8.2%에 불과하다는 것이다. 나머지 대부분은 염기서열에 손상이나 추가가 일어난 유전체의 부위, 즉 쓰레기다. 실제로 일을 하는 DNA의 8.2%의 중요성도 각기 다르다. 단백질을 부호화하는 것은 1% 남짓이다. 단백질은 신체의 중요한 생물학적 과정 거의 모두를 수행한다. 7%는 단백질을 부호화하는 유전자의 스위치를 켜고 끄는 일과 관련돼 있는 것으로 생각된다. 이런 작용은 각기 다른 시기에 다양한 요인에 반응해서 각기 다른 신체 부위에서 일어난다. 이들은 통제 및 제어 요인이며 그 유형은 다양하다. 인체에서 생산되는 단백질은 태어나서 죽을 때까지 모든 세포내에서 사실상 똑같다. 통제가 필요한 것은 어떤 시기에 어느 부위에서 어떤 단백질의 스위치를 켤 것인가다.

유전·진화·생화학적 접근법으로 나뉘어

이것은 크게 보아 기능적 DNA란 무엇인가에 대한 각기 다른 정의의 문제다. 하지만 이것은 단어의 정의에 대한 학문적 논쟁을 넘어서는 중요성을 지닌다. 환자의 DNA 염기서열을 분석할 때가 그런 예다. 만일 기능을 하는 것이 8%뿐이라면 거기에서 일어난 돌연변이만을 연구하면 된다. 의학적 관점에서 볼 때 인간의 유전적 변이가 질병에서 차지하는 역할을 해석하는 데 이것은 본질적인 부분에 해당한다.

인간 지놈에서 기능을 발휘하는 부분을 식별하기 위한 접근법은 3종류로 나뉜다. 하나는 겉으로 드러나는 표현형의 변화에 의존하는 유전학적 접근법이다. 또 하나는 유전자의 보존에 의존하는 진화적 접근법이다. 나머지는 생화학적 검사에 의존하는 생화학적 접근법으로 ENCODE팀이 사용했던 것이다. 이들 접근법은 모두 한계를 지닌다. 유전학은 생명체에서 물리적으로 발현하지 않는 기능적 요소들을 빠트릴 염려가 있다. 진화적 접근법은 다양한 종의 염기서열을 정확하게 정렬시키는 방법을 사용하는 데 한계가 있다. 매우 가까운 친척 종의 지놈도 크게 다를 수 있기 때문이다. 생화학적 접근법은 재현성은 높지만 생화학적 표지가 항상 자동적으로 기능을 의미하는 것은 아니기 때문에 문제가 있다. 코딩을 하지 않는  DNA는 유전적 상호작용의 복잡한 그물망과 관련돼 있으며 진화발생 생물학의 연구주제이기도 하다.

조현욱 과학과 소통 대표
서울대 졸업. 중앙일보 논설위원, 객원 과학전문기자, 한국외국어대 초빙교수 역임. 2011~2013년 중앙일보에 ‘조현욱의 과학산책’ 칼럼을 연재했다. 빅 히스토리와 관련한 저술과 강연에 힘쓰고 있다.

ADVERTISEMENT
ADVERTISEMENT