[2019 국내 바이오 성과 Top 5 선정] 연세대학교 김상우 교수
"1% 미세돌연변이까지 찾아내는 유전자 분석기술 개발"

The use of technical replication for detection of low-level somatic mutations in next-generation sequencing. Nat. Commun., 10, 1047 doi:10.1038/s41467-019-09026-y

인터뷰 내용
- 선정된 연구성과의 내용 및 의의
- 해당 분야의 최신 연구 흐름
- 함께 진행한 연구진 소개
- 앞으로의 연구 방향과 계획
- 연구주제에 대한 선택과 아이디어를 어떻게 얻으시는지?
- 과학자로서 아쉬운 점이나 개선에 관한 의견?
- 학생/후학들을 위한 조언
- 그 외의 말씀 또는 바람

김상우 교수 약력 (PDF파일)

김상우 교수

Q. 선정된 연구성과의 내용과 의의는 무엇인가요?

2000년 중반에 등장한 차세대 시퀀싱 (Next-generation sequencing, NGS)은 사람 유전자 30억 염기쌍을 단 며칠 만에 읽을 수 있게 해 주었고, 특히 암의 원인인 체세포 변이 (somatic mutation)를 매우 높은 정확도로 찾아낼 수 있게 해 주었습니다. 하지만 때때로, 시료 내의 체세포 변이 비율이 아주 낮은 경우들이 있는데, 문제는 NGS가 가진 근본적인 오류와 유전자 분석 과정에서 필요한 DNA 증폭이 일으키는 오류 때문에, 낮은 비율 (약 1% 이내)의 체세포 변이를 NGS로 찾아내는 것은 매우 어렵다는 것이었습니다. 심지어 얼마나 어려운지조차 제대로 알려지지 않아, 잘못된 결과를 얻기에 매우 쉬운 상황이었습니다.

저희 연구팀은 이번 연구에서 기존의 방법으로는 1% 이하로 존재하는 체세포 변이를 거의 찾아낼 수 없다는 것을 증명하였고, 나아가서 0.5% 비율의 변이까지도 탐지 가능한 새로운 알고리즘인 RePlow를 개발하였습니다. 이를 위해서 서로 다른 두 사람의 혈액을 섞어 0.5%-10%의 체세포 변이를 가지는 표준물질을 만들어, 검증에 활용했습니다. 그 과정에서 기존에 흔히 사용되던 10개 정도의 방법들은 1% 이하의 체세포 변이를 거의 탐지하지 못하는 것을 처음으로 확인하였고, 이러한 문제가 단순한 방법에 오류가 있어서가 아니라, 위에 설명한 DNA 증폭과 NGS의 오류 때문에 생기는 해결 불가능한 것이라는 것을 밝혔습니다. 이에, 저희는 이러한 변이를 찾기 위해서는 반드시 2회 이상의 반복 실험 (replication) 데이터가 필요하다 생각하였고, 반복 실험을 활용하는 완전히 새로운 알고리즘을 개발하였습니다. 검증 결과, 기존 방법들보다 오류를 약 99% 까지 줄일 수 있었습니다. 또한 이전 실험에서 체세포 변이를 찾지 못했던 뇌전증 시료를 다시 분석하여 약 0.5% 가량 존재하였던 원인 변이들을 새로 검출해 낼 수 있었습니다.

낮은 비율의 체세포 변이를 검증하는 것은 매우 중요한 문제입니다. 암 유전자 분석에서도 암 시료에 다른 세포들이 섞여 있는 경우, 이질성 (heterogeneity) 때문에 존재하는 적은 세포군들 때문에 변이를 놓치는 경우들이 있습니다. 최근에는 액체 생검 (liquid biopsy)과 같이 혈액에 떠다니는 미세한 변이를 탐지하는 기술을 개발하는 경쟁이 치열한데, 이 경우들도 약 0.1~1% 변이들을 찾아내야 합니다. 암 이외에도 발생과정에서 생기는 모자이크 (mosaic) 변이를 탐지하는 것도 모두 이 범주에 속합니다.

 

개발한 RePlow의 성능
이미지 1. 개발한 RePlow의 성능. RePlow는 약 1-1.3% 비율로 존재하는 체성변이를 대부분 찾아내었으며 (녹색: 탐지된 변이), 그 과정에서 위양 변이를 최대 99% 까지 제거함 (우측 그래프)

 

Q. 해당 연구분야의 최신 연구의 흐름은 어떤가요?

낮은 비율로 존재하는 체세포 돌연변이의 중요성이 인식된 이후 끊임없이 기술 개발이 진행되고 있습니다. 크게 두 가지 형태로 진행되고 있는데, 첫 번째는 시퀀싱 기술 자체를 발전시키는 것이고, 두 번째는 분석 알고리즘을 개선하는 것입니다. 시퀀싱 기술에 집중하는 예로는, 각 DNA를 개별 식별할 수 있는 바코드 (barcode)를 붙여 체세포 돌연변이가 얼마나 여러 DNA에서 독립적으로 나타나는지를 보는 방법과, 단일세포시퀀싱 (single-cell sequencing)을 이용하는 방법 등이 있습니다. 알고리즘적 접근법으로는 저희처럼 확률 모델을 개선해 보려는 시도가 많고, 최근에는 기계학습 (machine learning)을 접목하여 어려움을 돌파해 보려는 시도들이 있습니다.

Q. 함께 진행한 연구진을 소개 부탁합니다.

이 연구는 KAIST 이정호 교수님연구팀과 공동연구로 진행하였고, 특히 초기 개발 과정에서 이정호 교수님 연구팀의 도움을 많이 받은 연구입니다. 최초에 낮은 빈도의 체세포 변이를 측정할 수 있는 표준물질 샘플 제작 과정과 그 결과물의 확인을 이정호 교수님 연구팀에서 해 주지 않으셨더라면, 연구에 큰 어려움이 있었을 것입니다. 함께 연구하며 항상 많은 아이디어를 받기도 하고, 개발된 알고리즘을 바탕으로 뇌전증 (epilepy)이나 신경정신병, 퇴행성 질환에 숨어 있는 체세포 변이를 찾고 해석하는 후속 연구들을 활발히 진행 중에 있습니다.

RePlow는 저희 연구실 박사후과정이던 김준호 박사 (현, Harvard Medical School)가 주도적으로 개발하였으며, 알고리즘을 수립하고 프로그램화 하는 과정 전반을 담당하였습니다. 모델 개발 과정은 끊임없는 수식과의 싸움이었고, 많은 인내심이 필요했는데, 오랜 시간 동안 포기하지 않고 만들어 낸 김준호 박사의 노력을 칭찬하고 싶습니다. 또한 연세대학교 의과대학 본과 학생인 김다찬 학생이 김준호 박사와 함께 모든 시간 동안 많은 도움을 주었습니다.

 

김준호 박사 (좌), KAIST 이정호 교수 (우)
이미지 2. 김준호 박사 (좌), KAIST 이정호 교수 (우)

 

Q. 현재 해당 연구분야의 한계는 무엇인지, 향후 연구방향과 계획이 궁금합니다.

현재 많은 연구자들은 체세포 돌연변이의 탐지 한계를 어디까지 낮출 수 있는 지 궁금해 하고 있습니다. 예를 들어 액체 생검의 경우 혈액 내에 떠다니는 암세포 유래 변이의 비율이 0.1% 이하로 내려갈 수도 있는데, 더 낮은 비율을 정확히 탐지할수록 암을 조기에 찾아낼 수 있고, 또한 여러 암종에 적용할 수도 있습니다. 그러면서도, 한 번에 탐지할 수 있는 변이의 개수를 늘리려는 노력도 진행되고 있습니다. 그러나 발표되는 여러 기술의 정확성을 엄격하게 측정하기가 어려운데 이를 위해서 다양한 빈도의 변이를 포함하고 있는 대규모의 표준물질 (standard reference)의 제작이 시급합니다. 표준물질은 현재 활발히 진행되고 있는 유전자검사 기술을 평가하는 데에도 중요하게 사용될 수 있습니다. 또한 체세포 돌연변이들 중 일부는 질환 지역 이외의 부위에서도 발견될 수 있는데 (모자이크 변이), 이를 탐지하는 것은 완전히 새로운 이론에서 출발하는 알고리즘을 필요로 합니다. 저희 연구실은 최근 0.1%에서 약 50% 까지의 다양한 비율을 가진 표준물질을 제작하여 연구에 활용하고 있으며, 모자이크 변이의 탐지 알고리즘과 이를 이용한 조기 진단 기술 개발을 활발히 진행 중에 있습니다.

Q. 평소 연구주제에 대한 선택과 아이디어를 어떻게 얻으시는지?

가장 많은 아이디어를 얻는 것은 동료 교수님들과의 디스커션입니다. 다행히도 제 주변에는 정말 다양한 분야에서 최고 수준의 연구를 하시는 분들이 많습니다. 저희는 특정 생명현상이나 질병에 국한해서 연구하는 것이 아니라, 어떤 분야이든 풀어낼 수 있는 새로운 방법을 만들어 내는 기술을 가지고 있는 것이 특징입니다. 그렇다면, 그 기술을 어디에 사용할 것인지가 중요한데, 다양한 질병 연구를 들으면서 현재 막혀 있는 부분 (unmet needs) 가 무엇이고 우리가 할 수 있는 일인지를 항상 생각합니다. 또한 연세의대는, 환자를 실제 치료하시는 임상학 교수님들과 기초학 교수님들이 같은 건물에 섞여 있기 때문에, 언제든지 함께 어울려 연구할 수 있다는 것이 큰 장점입니다. 같은 노력을 들인다면, 지금 가장 필요한, 그리고 가장 사람들에게 도움이 될 수 있는 문제를 풀어야 하기 때문에, 주변 연구팀들과의 끊임없는 대화가 필요합니다.

Q. 과학자로서 연구활동 중 아쉬운 점이나 우리의 연구환경 개선에 관한 의견이 있으시다면?

너무 일이 많습니다. 마음은 연구가 항상 최우선이지만 당장 오늘까지, 내일까지 처리해야 할 일들 때문에 여유롭게 집중해서 연구활동을 하기가 어렵습니다. 바쁘다는 것은 단순히 연구 시간이 부족한 것도 있지만, 정말 창의성 있는 새로운 연구를 할 여유가 부족하다는 의미이기도 합니다. 이것은 제가 본 많은 교수님들에게도 똑같이 해당하는 문제입니다. 매일매일 쏟아지는 일들을 하다 보면 문득 이게 정말 필요한가 하는 의문이 들 때가 많은데, 아직까지도 사회 전반에 비효율적인 절차들이 많이 남아 있는 것 같습니다. 소모적인 일과, 잦고 형식적인 평가, 지나친 규제를 줄이고, 개별 연구자들의 자율성이 더 보장되어야 합니다. 다행히 최근에는 연구과제를 포함한 여러 프로세스들이 점차 좋아지고 있는 것이 보여 희망을 갖게 합니다.

Q. 같은 분야를 연구하려는 학생/후학들에게 도움이 되는 말씀을 부탁드립니다.

독립적인 연구자가 되어야 합니다. 학위 과정을 하다 보면 운이 좋게 본인이 큰 힘을 들이지 않았는데도 다른 사람의 도움을 받아 이름 올리고, 연구성과가 나오는 경우도 있고, 정말 본인이 처음부터 끝까지 만들어 내었는데도 잘 안 되는 경우도 있습니다. 모두들 전자를 부러워하겠지만, 저는 후자가 더 성공할 가능성이 높은 사람이라고 생각합니다. 내 능력으로 한 일이 아닌 일로 좋은 평가를 받고 다음 과정으로 나아가는 것은 단지 큰 위험을 뒤로 미룬 것에 지나지 않습니다. 그 이후 과정도 마찬가지입니다. 또 비슷한 방법으로 연구성과를 만들어서 설령 교수나 연구책임자가 되었다고 해도 그 뒤에 더 큰 문제가 생기게 됩니다. 반면, 본인의 노력으로 승부를 보는 사람들은 비록 계획보다 느리더라도 그 다음 과정에서 반드시 인정받게 됩니다. 자기 자신을 믿고, 내가 진짜 실력자가 되어야 한다고 생각하면서 노력한다면, 얼마간의 시간이 지난 후 진짜 그렇게 되어 있는 본인의 모습을 보게 될 것입니다. 저는 이런 사람들이 그 어려운 과정에서 포기하지 않도록 응원하고 격려해 주고 싶고, 좋은 평가를 받을 수 있는 시스템을 함께 만들어 가야 한다고 생각합니다.

Q. 그 외 추가하고 싶은 말씀 또는 바람이 있다면?

다른 더 훌륭한 연구들과, 연구팀들과 함께 소개될 수 있어 영광이고 한편 부끄럽습니다. 또 이렇게 잠깐이라도 뿌듯함을 느낄 수 있는 기회를 만들어 주신 BRIC 관계자 분들에게 진심으로 감사의 말씀을 드리고 싶습니다. 작성하면서, 더 큰 꿈을 꿀 수 있는 시간이었던 것 같습니다. 감사합니다.

 

연세의대 중개유전체정보학연구실 (TGIL) 멤버들과 함께
이미지 3. 연세의대 중개유전체정보학연구실 (TGIL) 멤버들과 함께

 

----------

< 2019 국내 바이오 연구성과 Top 5는 써모 피셔 사이언티픽 코리아의 단독후원으로 진행되었습니다. >

관련 사이트 :
- 2019 국내 바이오분야 연구성과 및 뉴스 Top 5
- 연구자가 선정한 2019 국내 바이오 성과∙뉴스 Top 5 (Bio통신원 2019-12-17)

주소복사
댓글 (0)
HOME   |   이용약관   |   개인정보처리방침
© BRIC