05/28/2020

한국인 1천명 게놈 빅데이터 구축… 질병 분석력 높인다

By unist-1245 Views-No Comment

UNIST, ‘한국인 1천명 게놈(Korea1K)’ 발표… ‘울산 만명 게놈 프로젝트’ 성과
암 등의 질병 맞춤 정밀의료 분석 가능… Science Advances 논문 게재

UNIST 게놈산업기술센터(KOGIC)는 한국인 1,094명의 ‘전장 게놈(유전체)’과 건강검진 정보를 통합 분석한 ‘한국인 1천명 게놈(Korea1K)’ 결과를 국제학술지 사이언스 어드밴시스(Science Advances) 5월 27일자로 발표했다. 본 사업은 2015년 선언된 ‘Genome Korea in Ulsan’ (울산 만명게놈사업)의 일환으로, 한국인의 모든 유전적 다양성을 지도화하기 위해 첫 번째 대규모 데이터를 공개했다. 2020년까지 1만명의 게놈 데이터를 확보할 예정이며, 모든 국민이 참여할 수 있는 일종의 ‘국민게놈사업’이다.

이번 한국인 1,000여명의 게놈 정보를 영국과 미국에서 2003년 완성한 인간 참조 표준 게놈지도(GRCh38)와 비교한 결과 총 3,902만 5,362개의 변이가 발견됐다. 한국인 1천명의 게놈이 인간표준게놈과 다른 염기 약 4천만 개를 가진다는 것이다. 특히, 이번에 발견한 변이 중 34.5%나 되는 엄청난 양의 유전자 변이가 한국인 집단 내에서 한 번만 발견되는 독특한 변이(Singleton variant)로 파악됐다. KOGIC의 센터장인 이세민 교수는 “한국인의 개인 특이적 혹은 낮은 빈도의 희귀한 유전변이의 기능과 역할을 잘 설명하려면 더 방대한 게놈 빅데이터 확보가 절실하다”고 전했다.


Korea1K (한국인 1천 명 게놈 정보)를 활용한 암 분석 개선

‘한국인 1천명 게놈(Korea1K)’은 한국인의 암과 관련 있는 유전변이, 즉 ‘암 조직 특이 변이’ 예측도에서 우수한 결과를 보였다. 기존 한국인 위암 환자의 암 게놈 데이터를 한국인 1천명 게놈(Korea1K)과 대조군으로 다른 인족(일본인, 동아시아인, 유럽인, 아프리카인 등)의 변이체 데이터와 비교해 암세포와 관련 있는 체세포 변이(somatic variant)를 찾는 예측을 진행했다. 그 결과, 기존의 타 인족 중심 변이체를 사용했을 때 보다 한국인 1천명 게놈(Korea1K) 데이터를 활용했을 때 암 조직 특이 변이 예측의 정확성이 가장 높았다. 이것을 분석한 최연송 연구원은 “이것은 Korea1K의 실용적 가치도 매우 큼을 뜻한다” 고 Korea1K가 표준성과 더불어 응용성도 있음을 설명했다.


Korea1K(한국인 1천 명 게놈 정보)를 활용한 전장 게놈 연관분석

한국인 1천명 게놈(Korea1K)에는 건강검진 결과와 유전변이 간 상관관계 분석(전장 유전체 연관 분석, GWAS)된 결과도 담겨있다. 여기에 따르면 혈액검사로 알 수 있는 중성지방, 갑성선 호르몬 수치 등 총 11개 건강검진 항목이 15개의 게놈 영역에서 467개의 유전자 변이와 관련 있다. 이 중 4개 영역은 이번에 새롭게 발견됐으며, 9개 영역에서는 기존에 알려진 것보다 상관관계가 높은 변이를 알아냈다. 제1저자들인 생명공학과의 전성원 연구원과 박영준 연구원은 “과거의 GWAS 연구가 한정된 영역에서의 유전변이만 볼 수 있는 반면에 이 연구에서는 한국인 게놈 전체를 대량으로 읽어서 분석했기 때문에 더 정확한 유전자 연관성을 얻을 수 있었다.” 라고 평하고, “미래엔, 대부분의 유전자 연구가 전장게놈을 가지고 행해질 것 같다”고 설명했다.

송철호 울산광역시장은 “국가 바이오 산업 발전을 위해 울산 게놈 빅데이터와 그간의 경험을 다른 국가 바이오 빅데이터 구축 사업 및 기업, 병원, 대학연구자 등에게 공유해 국내 바이오 산업 육성에 주춧돌 역할을 다할 것”이라며 “금년 내 1만 명 게놈 해독 완성을 위해 적극 지원하겠다”고 밝혔다. 울산시는 2015년부터 ‘게놈코리아 인 울산 사업’을 추진해 게놈 기반 바이오헬스산업을 육성하고 있다.

울산만명게놈사업은 참여자의 자발적 참여 동의를 바탕으로 게놈 정보와 의료 정보를 수집했으며, 가명화 및 익명화 절차를 통해 개인정보를 안전하게 보호한다. 이번 연구에서는 최소 1페타바이트(1PB)의 저장공간 (5MB 노래 파일 2억 개)이 필요한 1,094명의 초대형 바이오 빅데이터를 구축하였다. Korea1K 데이터는 국가적으로 공유되고 활용되기 위해 최대한 공개되어 다양한 한국인 게놈 데이터 생산에 활용될 예정이다. 한국인 1천명 게놈(Korea1K) 변이체 연구의 결과 중 한국인 내 변이빈도는 Korea1K 웹페이지 (http://1000genomes.kr/)에서 누구나 열람할 수 있다. 연구팀은 앞으로 1만 명까지 게놈 및 임상 데이터를 추가로 확보, 분석해 한국인의 유전자 표현형 분석, 질병 예측에 필요한 정밀의료데이터를 마련할 예정이다.

한국인 게놈사업을 오랫동안 수행해온 KOGIC의 박종화 교수는 “한국인 게놈 사업은 2006년부터 과학기술정보통신부와 산업통상자원부의 지원으로 시작해, 국가참조표준센터·게놈연구재단·숭실대·한의학연구원·카이스트·하버드의대·케임브리지 등 다양한 국가·인족·문화 배경의 사람들이 게놈 기반 공공 빅데이터를 구축하기 위해 시작됐다”며 “과기부와 울산시의 지대한 지원에 감사드리며, 앞으로도 과학연구의 목적에 어울리게 한국 국민과 인류 전체에 활용되기를 희망한다”고 전했다.

참고논문: Sungwon Jeon et al., Korean Genome Project: 1094 Korean personal genomes with clinical information, Science Advances, https://doi.org/10.1126/sciadv.aaz7835