수업후기
제7강 (2021.07.11) 유전자 변형(Gene modification)
#0
2012년 Yamanaka factor로 노벨생리의학상, 2015년에는 DNA Damage로 노밸화학상 , 2020년에 크리스퍼 가위로 노벨화학상을 받았다. 크리스퍼 가위는 상동재조합(HR)과 비상동말단결합(NHEJ)을 이해해야 한다. 아마도 앞으로는 mRNA백신으로 노벨상을 받을 가능성이 있다.
코비드-19를 제대로 볼 필요가 있다. 바이러스와 진핵세포의 관계를 보는 것이다. 바이러스로 인류가 5억 이상 사망했다. 현재까지 코비드-19에 전세계 400만명이 사망했다. 1918년에 발발한 스페인독감은 5000만명이 사망했다. 천연두는 1980년 종식될때까지 5억명이 사망했을 것으로 추정한다.
바이러스가 뭔가? 이제 인류가 안다. 올해 강의 주제는 RNA World이다. 화이자와 모드나의 백신은 mRNA를 주입하는 것이다. 코비드-19는 RNA만 가지고 있는 바이러스이다. 단백질은 4종류(M, E, S, N) 를 가지고 있는데, 모두 진핵세포가 제공한 것이다. 인지질막도 진핵세포에서 빠져 나올 때 가지고 온 것이다. 바이러스 꺼는 RNA뿐이다. 왜 바이러스는 RNA 1개만 가지고 다니는가? 이것만 있으면 다 되기 때문이다. 그것이 정보이다. RNA로 번식할 수 있고 단백질을 만들 수 있다. ‘생명이 어떻게 작동하는가’를 가장 잘 볼 수 있는 예이다.
#1
바이러스가 어떻게 살아가는가? 이것을 이해해야 크리스퍼 가위를 이해한다. 코비드-19는 RNA-World를 종합적으로 이해할 수 있는 교과서이다.
코로나바이러스는 +gRNA이다. +는 5’->3’ 방향으로 염기가 배열된 것이고, g는 genome으로 게놈이 RNA로 되어 있다는 것이다. 또한 RNA분류상 ssRNA인데, single strand RNA를 가진 것이다. 단백질은 4종류가 있는데, RNA 주위에 붙어서 염기이빨을 보호하고 있는 단백질이 nucleocapsid protein(N)이다. 지질막에는 Spine protein(S), Membrane glycoprotein(M), Envelope protein(E)이 박혀 있다.
코로나바이러스는 진핵세포막의 수용체 ACE2(Angiotensin-converting enzyme 2)를 통해 세포 안으로 들어온다. 바이러스의 RNA는 5’-cap 다음에 5’-UTR(untranslated region)이 있고, 다음에 PP1a와 PP1b의 NSP(non-structure protein)를 만드는 영역이 있다. 다음으로 S, E, M, N 단백질을 만드는 Protein coding region이 있고, 다음으로 3’-UTR과 AAA의 3’ 꼬리로 되어 있다. 염기수는 29903개 NT로, 9860개의 아미노산과 25개의 단백질을 만든다.
인간의 32억개 NT군대가 바이러스의 3만 NT군대에 당하는 이야기이다. 바이러스가 들어와도 가만 있으면 아무 일도 안 일어난다. 그러나 수없이 떠돌아다니는 진핵세포의 리보솜과 충돌하는 일이 벌어진다. 그러면 바이러스의 RNA를 읽어서 단백질이 만들어진다.
먼저 리보솜이 붙어서 PP1a, PP1b의 NSP를 만든다. PP1a는 1~11까지의 단백질이 있고, PP1ab는 1~16까지 단백질이 있다.
NSP1은 인터페론의 스위치를 끄고, 경비역할을 하는 숙주세포의 RNA를 파괴한다. 도둑이 침입하면 먼저 cctv선부터 자르고 경비시스템을 무력화하는 것과 비슷하다.
NSP2, 11은 기능이 알려져 있지 않다.
NSP3, 5, 15는 protease로 닌자가 되어 난도질하는데 NSP를 끊어준다.
NSP4, 6은 DMV(double membrane vesicle)의 보호막을 만들어 뒤집어 쓰게 해준다.
NSP7, 8, 9, 10, 12, 13, 14는 RTC(Replication Transcription complex)가 되는데, 12번 RdRp(RNA dependent RNA polymerase)가 코어가 된다. 진핵세포는 DNA->DNA를 복제(Replication), DNA->RNA를 전사(Transcription)라고 하는데, 바이러스는 RNA->RNA로 복제와 전사를 동시에 한다. NSP10은 Clip을 하고, 13은 Helicase로 꼬인나선을 풀어주고, 14는 editing을 한다.
#2
이제 준비동작이 끝났다. 바이러스 10마리가 들어와 1000마리가 되어 나가는 게임이다. RNA원본이 10개이니 원본 1000개를 만드는 복제(Replication)과정을 해야 한다. 또한 단백질 4종류를 1000세트를 만드는 mRNA 전사(transcription) 과정을 해야 한다. 복제와 전사를 구분해서 적는 것이 gDNA(genome DNA)와 sgDNA(subgenome DNA)이다. 또한 +와 –로 염기 복제와 전사 방향을 구분한다.
gDNA에서 원본 1000세트를 만드는 복제과정은 다음과 같다. 5’->3’의 +gRNA 원본에 미리 만들어 놓은 RTC(Replication Transcription complex)가 붙어서 반대방향인 3’->5’으로 복제를 한다. 그러면 3’->5’이고 꼬리가 UUU인 –gRNA가 만들어진다. 그러면 다시 RTC가 –gRNA에 붙어서 복제를 하면 +gRNA가 된다. 네거티브를 1벌 만들고 포지티브를 40번 반복하여 40벌을 복제하는 방식이다.
sgRNA에서 1000세트의 단백질 4종을 만드는 전사과정은 다음과 같다. +gRNA가 조면소포체에 꼬리를 고정시킨다. 그러면 RTC가 붙어서 3’부터 이빨을 박아오는데, S단백질 부위를 전사하면 그 앞에 TRS-B(transcription regulatory sequence-Body)부위에서 분리가 되어 붕 떠서 5’ 머리부분의 TRS-L(transcription regulatory sequence-Leader)에 붙어 전사하고 마무리한다. PP1a, PP1b는 전사할 필요가 없기 때문이다. 그렇게 만들어진 –sgRNA는 네거티브이므로 단백질을 만들려면 포지티브로 바꾸어주어야 한다. 다시 RTC가 –sgRNA에 붙어서 3’에서부터 전사를 하여 5’->3’의 +sgRNA를 만든다. +sgRNA는 5′ leader sequence 다음에 S단백질 sequence가 위치하는데, 리보솜이 붙어서 스파인 단백질을 만들어낸다. 반복하여 1000세트를 만들 수 있다. E, M, N 단백질도 동일한 과정으로 만들어진다.
#3
다음은 조립과정이다. 리보솜이 붙은 mRNA가 소포체(ER)에 붙어서 단백질(M,E,S)이 만들어지면 소포체에 심어진다. 단 N단백질은 gRNA 원본과 결합한다. 소포체가 감싸서 단일막의 원이 되어 진핵세포막을 Exocytosis를 통해 빠져 나간다.
TRS(transcription regulatory sequence)가 구체적으로 무엇인가 알아보자. gRNA가 휘어져 구조가 만들어진다. 5’ leader 다음 부위가 고리모양으로 되어 있는데 이 부위를 TRS-L(Leader)이라고 한다. 단백질을 코딩하는 부위 앞에 TRS-B(body)가 위치하는데, 꼬리부위가 휘어지면서 TRS-L부위와 마주보게 되어 상보코드로 수소결합이 된다. RTC가 3’에서부터 이빨을 박아가다가 TRS-B를 만나면 TRS-L과 수소결합되어 있기에 진행하지 못하고 분리되어 뜨면서 5’의 leader부위로 가서 이빨을 박아 완성한다.
#4
mRNA 백신에 대해 알아보자. 백신을 만드는 어려운 기술 첫번째는 mRNA를 감싸는 인지질막을 찾는 것이다. 수많은 실패 끝에 적합한 인지질막을 찾았다. 두번째는 S단백질을 만드는 이빨 1080개중 40개를 변형시키는 것이다. S단백질을 제시하여 B세포가 학습하여 면역을 획득할 때까지만 살다가 사라져 주도록 변형하는 기술이다. 그래야 효과와 안전성을 가진다. 이 modification 기술이 핵심기술로 노화를 되돌리는데도 응용이 될 수 있다.
코로나 백신의 modification 부위는 다음과 같다.
5’ cap의 분자구조를 그려보면, cap-0, 1, 2…로 이어지는데, cap-0의 구아닌 7번에 메틸기(CH3)가 붙는 것(m7G), cap-1의 아데닌 6번에 메틸기가 붙는 것(m6A), cap-1의 리보오스의 OH의 H가 떨어지고 메틸기가 붙는 것, cap-2의 리보오스의 OH의 H가 떨어지고 메틸기가 붙는 것으로 modification된다.
5’ UTR의 변형은 전사율(translation rate)과 관계된다.
단백질 부위의 modification은 아데닌 1번에 메틸기가 붙는 것(m1A)이 있다. 그러면 +전기를 띠면서 반응도가 높아진다. 시토신 5번에 메틸기가 붙는 것(m5C)과 하이드록시메틸(hydroxyl-methyl)이 붙는 것(hm5C)가 있다. Uridine 의 질소 위치를 바꾼 Pseudouridine(Ψ)으로 modification한다.
3’ UTR은 m6A, m5C로 변형하여 핵에서 빠져 나갈 때 유리하게 만든다.
mRNA modification은 mRNA의 안정성(stability)과 관계된다. mRNA 백신이 적당히 살아남기 위해 어디에 얼마를 변형하는가는 바이오기업의 영업비밀이다.
그래서 다 같은 RNA가 아니다. 메틸기가 붙는 위치에 따라 상황이 달라진다. 5’ cap의 변형에 따라 mRNA의 안정도가 달라지고 단백질 만드는 숫자가 달라진다. 침팬지와 인간의 차이도 여기서 온다. Modification이 진화의 핵심이다. 후성유전학도 그러하다. 내가 살아 온 신념, 음식, 습관이 모두 다 modification과 링크되어 있다. 그래서 modification을 조절할 수 있는 기술이 정립된다면 젊어지는 백신이 나올 가능성이 충분하다.
#5
mRNA 백신의 구조를 알아보자. mRNA는 Spine 단백질을 만들어주는 부위이다. mRNA에 전기를 띠는 이온화된 지질(charged ionizable lipid)을 붙여주어 안정화를 시킨다. mRNA는 직경 80nm의 막으로 둘러싼다. 막은 PEG(polyethylene glycol) lipid, neutral ionizable lipid, DSPC(Di stearoyl phosphatidyl choline)의 막으로 되어 있고 콜레스테롤이 박혀있어 유동성을 확보한다. PEG lipid에는 꼬리가 달려 있다.
#6
2020년 노벨화학상을 받은 크리스퍼 가위(CRISPR/Cas9)를 알아보자. 바이러스와 박테리아의 게임이다. 한국에도 세계적인 전문가인 김진수 교수가 있다. 분자세포생물학은 자르고 붙이고 2가지이다. DNA의 DSB(Double strain break)는 재앙이다. 암이 되고 랜덤하게 잘라지는 자연현상이다. 크리스퍼 가위는 제어된 절단이다. 어디를 자르는지 알고 있다 인간 게놈의 1/1000인 박테리아의 게놈을 자르는 효소가 3000개 발견되었다. 특별한 부위를 자르는 site-specific 단백질효소를 이용하는 것을 생명공학이라고 한다.
1천만명의 주민을 염기이빨로 주민등록증을 만들어준다고 하면, AGCT 4자리로 주민등록증을 만들면 동일한 주민등록증을 가진 주민이 수백명이 된다. 이것이 1세대 가위이다. 주민등록번호를 10자리를 만들면 겹치는 숫자가 훨씬 적을 것이다. 이것이 2세대 가위이다. 20자리로 주민등록증을 만들면 같은 번호가 나올 가능성은 희박하다. 그래서 인간에게 써도 된다. 이것이 3세대 크리스퍼 가위이다.
인간의 30억개 염기 코드서열을 다 가지고 있다. 혈우병 유전자 돌연변이를 정상으로 바꾸려면 돌연변이 부위를 유전자 가위로 자르고 정상염기를 HR로 설계해서 척 붙이면 된다. 원리적으로 2만개의 인간 유전자를 마음대로 재설계해서 붙일 수 있다. 그러기에 10년내 젊어지는 백신 나와도 놀랄 일이 아니다. 크리스퍼 가위(CRISPR/Cas9)의 CRISPR는 RNA이고, Cas9은 단백질이다. 그래서 RNP이다.
박테리아 게놈에서 동일한 서열이 나와서 의심하다가 나중에 해석하여 박테리아 면역시스템임이 밝혀졌다. 바이러스와 싸우다가 적을 생포해서 편입시켜 버린 서열이다. 다시 적이 들어오면 전에 들어온 서열을 알고 있으니 가위로 잘라 버린다.
박테리아 게놈은 dsDNA이다. 유전자 앞쪽의 크리스퍼 위치의 tracrRNA(trans-activating crispr RNA) 부위에서 전사하여 tracrRNA를 만든다. 또한 Cas9(CRISPR associated protein 9) 부위에서 전사하여 Cas9 단백질을 만드는데, RuvC와 HNH 영역이 있으며 핵산분해효소(nuclease)가 된다. 또한 cas1, cas2, csn2 부위와 leader 부위가 있으며 다음으로 유전자 부위가 있다.
유전자 부위에 박테리아 기원의 반복서열이 있는데, 반복되는 사이에 바이러스 기원의 다양한 게놈이 박혀있다. 여러 시기에 걸쳐 바이러스가 박테리아에 침입하여 남기고 간 서열이다. 만일 1천년전 바이러스와 동일한 바이러스가 박테리아로 들어오면 바이러스의 동일한 서열부위가 붙은 박테리아 반복서열을 잘라낸다. 반복서열은 tracrRNA와 상보결합을 하고 cas9 핵산분해요소와 같이 동작한다. 새로 침입한 바이러스의 게놈에 들어가 바이러스 주민등록번호를 확인하는 절차를 거쳐 염기서열이 맞으면 cas9의 RuvC와 HMN이 가위가 되어 바이러스 염기를 잘라낸다.
#7
이 방식을 유전병 치료에 사용한다. 유전병을 일으키는 잘못된 유전자를 찾아서 크리스퍼 가위로 잘라내고, DSB의 HR방식으로 교정된 유전자를 재조합한다. 이를 게놈편집(Genome editing)이라고 하는데, 장소특정핵산분해효소(site specific nuclease)를 이용한다. 1세대는 ZFN(Zinc-finger nucleases), 2세대는 TALEN (Transcription activator like effector nuclease), 3세대가 크리스퍼 가위로 cas9/CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)이다. 크리스터퍼 가위는 20자리 NT를 확인하기에 정확하다.
발티모어(David Baltimore)의 바이러스 분류와 바이러스 기원설 3가지를 알아보자. dsDNA, ssDNA, dsRNA는 퇴화세포설(degenerated cell hypothesis)과 관련된다. +ssRNA, -ssRNA는 탈출설(eacape hypothesis)과 관련된다. ssRNA-RT, dsDNA-RT는 새기원설(new origin hypothesis)와 관련된다.