산업 / 제약·바이오
“정밀의학 초석 'WGS' 시대 개막…디지털이 바꾸는 의료 패러다임”
TGTCATTAGGGTGCGG… 위 사진 속 빼곡한 텍스트는 사람의 유전자 염기서열 일부를 옮겨 적은 것이다. 단순한 문자 배열처럼 보이지만, 이 안에는 생명의 설계도가 숨겨져 있다. 전체 염기서열은 무려 30억개에 달해, 모니터를 가득 채워도 모두 담기 어렵다. 이 방대한 코드 속 단 하나의 오류만으로도 희귀 유전 질환이 발생할 수 있으며, 시간이 흐르면서 치명적인 질병으로 이어질 수도 있다.이 작은 오류를 찾아내는 것은 곧 생명을 구하는 일이다. 질병을 조기에 파악하고, 치료 전략을 세우는 데 결정적인 단서가 되기 때문이다. 하지만 사람의 눈으로 이 방대한 염기서열을 분석하는 것은 사실상 불가능하다. 오직 디지털 기술만이 이 미세한 차이를 감지할 수 있다. 디지털 기술이 의료의 패러다임을 근본적으로 변화시키며 새로운 시대를 열었다는 평가가 나오는 이유다.사진 속 아래 줄에서 위로 여섯 번째 줄의 왼쪽 다섯 번째 노란색으로 표시된 ‘C’가 오류 코드에 해당한다.고려대학교 의과대학 최정민 교수는 최근 AWS(Amazon Web Services, 아마존웹서비스)가 서울 강남구 코엑스에서 개최한 ‘Healthcare & Research Community Day(헬스케어 & 리서치 커뮤니티 데이)’에서 전장 유전체 시퀀싱(Whole Genome Sequencing, WGS) 시대의 개막을 알리는 발표를 선보였다.WGS는 생명체의 유전 정보를 총체적으로 해독하는 혁신적인 기술이다. 인간의 30억개 염기쌍을 모두 분석해 유전자 수준에서 변이와 특성을 정밀하게 파악할 수 있다. 기존 유전자 분석이 특정 유전자나 제한된 영역만을 다뤘다면, WGS는 유전체 전체를 대상으로 보다 광범위하고 심층적인 분석을 가능하게 한다.이를 통해 암, 희귀질환, 유전질환 등의 원인 변이를 더욱 정확하게 찾아낼 수 있으며, 단순한 유전자 분석을 넘어 환자의 유전적 특성에 맞춘 최적의 치료법을 제공해 부작용을 최소화하는 등 개인 맞춤형 정밀의료 혁신을 가속화하고 있다.약업신문은 최근 최정민 교수와의 인터뷰를 통해 디지털 기술이 의료 패러다임을 어떻게 혁신하고 있는지, 이를 통해 우리가 실질적으로 어떤 혜택을 얻을 수 있는지 집중 조명했다.'전장 유전체 시퀀싱 시대가 개막했다'라는 말이 자주 언급되고 있다. 당장 피부로 와 닿지 않는데, 이 말은 정확히 어떤 의미를 나타내는지.WGS 시대가 열렸다는 것은 환자 한 사람의 유전체 정보를 처음부터 끝까지 빠짐없이 해독할 수 있게 됐음을 의미한다. 이는 곧 정밀의학(Precision Medicine)으로 나아가는 토대를 마련했다는 뜻이다.기존에는 특정 유전자나 엑솜(Exome) 중심의 부분적 분석에 그쳤고, 이로 인해 관찰할 수 있는 변이의 종류에 한계가 있었다. 그러나 이제는 구조가 복잡한 변이까지도 상세히 파악할 수 있어, 희귀질환 연구와 맞춤형 치료 분야에서 혁신적인 전환을 가져왔다.특히 클라우드 컴퓨팅, AI, 빅데이터 분석 기술의 급속한 발전은 WGS 분석으로 생성되는 방대한 데이터를 처리하고 해석하는 방식을 완전히 바꾸고 있다. 질환 관련 바이오마커 발굴과 신약 후보 물질의 선별 과정 등, 의약학 시스템이 한층 정교하고 체계적으로 발전하게 된 것이다. '전장 유전체 시퀀싱 시대의 개막'은 의료와 제약바이오 산업 전반에 패러다임의 대전환을 가져올 것으로 보인다.해외에서는 WGS 데이터를 활용한 초정밀 개인 맞춤 치료가 활발히 이뤄지고 있다고 알고 있다. 현재 해외 의료 현장에서 WGS 사용 현황은 어느 정도인지.미국과 유럽에서는 이미 희귀질환 환자에게 WGS나 WES(전장 엑솜 시퀀싱)를 기본적으로 권고하는 시스템이 자리 잡았다. 진단이 어려웠던 희귀질환에서도 진단율을 최대 40% 이상 끌어올린 것으로 보고됐다.특히 환자들이 여러 병원을 전전하며 정확한 진단을 받는 ‘진단 방랑(Diagnostic odyssey)’ 기간도 크게 줄어들었다. 질병의 원인을 조기에 규명함으로써 불필요한 검사와 치료를 줄이고 환자의 삶의 질을 획기적으로 개선할 수 있다는 점에서 의료적, 사회적 의의가 크다.암 치료 분야에서도 유전체 정보 분석이 점차 표준화되는 추세다. 특정 항암제에 대한 반응성이나 내성 발생 가능성을 사전에 예측함으로써 환자별 맞춤형 치료 전략을 수립할 수 있기 때문이다. 특히 액체생검(Liquid biopsy) 같은 첨단 기법이 도입되면서 혈액 검사만으로도 유전자 변이를 파악해 환자 맞춤형 치료 방안을 빠르게 제시하는 사례도 점점 늘어나고 있다.국내에서 WGS 활성화가 더딘 이유는 무엇이라고 보는지. 또한 이를 개선하기 위한 방향에 대한 의견 부탁드린다.국내에서는 아직 시퀀싱 비용이 높은 편이라 대규모 도입에는 재정적 부담이 크다. 또한, 유전체 정보는 민감한 개인 정보로 분류되므로 연구나 의료 목적으로 활용하려면 법적·윤리적 규제를 엄격히 준수해야 한다. 하지만 관련 기준이 아직 명확하지 않아 개인정보 보호 문제가 복잡하게 얽혀 있는 상황이다.더불어 대규모 유전체 데이터를 처리하고 분석할 인프라와 전문 인력이 부족한 점도 활성화를 저해하는 주요 원인으로 지적된다. 이를 해결하려면 국가 차원에서 WGS 인프라를 확충하고, 데이터 표준화와 보안 체계를 구축하는 데 적극 나설 필요가 있다. 동시에 유전체 빅데이터 분석 전문가, 임상의, 소프트웨어 개발자 등 다양한 분야의 전문 인력을 양성하는 것도 반드시 병행돼야 한다.즉, WGS와 관련된 인프라·인력·법·제도가 조화롭게 발전해야 국내에서도 WGS 활용도가 크게 높아질 수 있다.국가 통합 바이오 빅데이터 사업을 통해 한국인 16만명의 WGS 데이터를 구축한다고 들었다. 이 사업이 가지는 의미와 기대할 수 있는 실질적인 이점은.이 대규모 데이터 구축 사업은 두 가지 측면에서 중요한 의미를 가진다. 첫째, 국가 경쟁력 강화다. 해외 대규모 유전체 데이터에 의존하던 한계를 극복하고, 한국인 특성에 맞춘 대규모 유전체 코호트를 국내 연구진이 직접 활용할 수 있게 됐다는 점이 핵심이다. 이를 통해 한국인 유전체 특성에 최적화된 진단과 치료법을 개발함으로써, 의료·제약 분야에서 글로벌 경쟁력을 한층 높일 수 있게 된다.또한 국민 건강 증진 효과도 기대할 수 있다. 국가 통합 바이오 빅데이터 사업을 통해 축적된 기술과 데이터를 기반으로 특정 유전 변이를 신속히 찾아낼 수 있게 되면서, 희귀질환의 진단 기간이 대폭 단축되고 중증 질환의 맞춤형 치료도 더욱 수월해진다.특히 대규모 유전체 데이터를 활용한 신약 개발의 성공 가능성이 높아져 국민 전체의 의료 서비스 수준이 향상될 것으로 전망된다.국가 통합 바이오 빅데이터 사업 중 교수님께서 진행하시는 연구에 대해 더 구체적으로 설명 부탁드린다.현재 국가 통합 바이오 빅데이터 시범사업의 일환으로 생산된 WGS 데이터를 활용해 대규모 유전체 데이터를 분석할 소프트웨어와 파이프라인을 구축하고 있다. 이는 해당 사업에서 확보될 대규모 데이터를 효과적으로 분석하기 위한 사전 준비 작업이기도 하다.특히 1만5000명의 희귀질환 환자와 4000명의 정상인 데이터를 기반으로 미진단 희귀질환의 원인을 규명하고 진단율을 높이는 데 주력할 계획이다. 현재 의학 기술로는 병명이나 원인을 명확히 특정할 수 없는 희귀질환 환자들이 여러 병원을 전전하며 고통받고 있으며, 이러한 질환은 환자 수가 적고 정보가 부족해 진단과 치료가 매우 어렵다. 현재까지 6000여개 이상의 미진단 희귀질환이 알려져 있으며, 이들을 위한 해결책이 시급하다.이에 따라 대규모 코호트를 구축해 희귀질환군과 대조군의 유전자 변이를 비교·분석하고, 통계 알고리즘과 딥러닝 기법을 적용해 변이와 임상 정보 간의 상관관계를 도출함으로써, 발병유전자를 동정해 분자적 진단율을 향상하는 연구는 매우 의미가 크다.나아가 이러한 분석을 효율적으로 수행할 수 있도록, 클라우드 환경에서 파이프라인을 미리 구축하고자 한다. 실제 코호트에 적용함으로써 질환의 기전을 깊이 이해하고 진단 성공률을 향상시키는 데 집중할 계획이다. 궁극적으로 이 프로젝트는 바이오마커에 기반한 맞춤형 치료와 예방 전략을 수립하는 데 중요한 기반이 될 것이다.WGS 데이터 활용에서 클라우드가 필수적인 이유는 무엇인지.한 사람의 WGS 데이터는 100GB에 달하며, 이를 수만 명 수준으로 확장하면 데이터 규모는 페타바이트(PB) 단위로 방대해진다. 이러한 대규모 데이터를 자체 서버에 저장하고 분석하기에는 물리적·운영적 한계가 뚜렷하다. 반면 클라우드 환경에서는 필요한 시점마다 인프라를 유연하게 확장할 수 있어, 해외 연구기관과의 협업도 훨씬 용이하다.이와 같은 클라우드의 장점을 활용해 전 세계적으로 범국가적 차원에서 WGS 데이터를 클라우드 기반으로 분석하는 사례들이 점점 증가하고 있다. 대표적으로 영국 정부 주도의 ‘Genomics England’ 프로젝트가 있다. 이 프로젝트는 영국 정부가 주도해 10만명의 희귀질환 및 암 환자의 WGS 데이터를 수집하고, AWS 기반 플랫폼에서 데이터를 관리 및 분석해 맞춤형 의료를 제공하려는 목적을 가진 프로젝트다.또한 International Cancer Genome Consortium(ICGC)는 암 정복을 목표로 2만5000명의 암 환자 샘플에서 WGS를 포함한 다차원 오믹스 데이터를 생성하는 국제 컨소시엄이다. 이 프로젝트에서 생성된 데이터는 AWS 등 여러 클라우드 플랫폼에 분산 저장돼 있으며, 연구자들이 전 세계 어디에서든 데이터에 접근해 분석할 수 있도록 개방돼 있다.이 외에도 지구상의 모든 진핵생물 180만 종의 WGS 데이터를 10년 안에 해독하고 공유하는 것을 목표로 하는 국제 컨소시엄 프로젝트인 Earth BioGenome Project(EBP), 유전체학 및 보건의료 발전을 위해 전 세계 연구기관과 의료기관이 협력하는 국제 연합체 Global Alliance for Genomics and Health(GA4GH)가 진행하는 프로젝트 등이 있다.이러한 사례들은 대규모 WGS 데이터를 효율적으로 관리하고 분석하는 데 클라우드 기술이 필수적임을 보여준다. 또한 범국가적 협력을 통해 데이터 공유와 공동 연구를 촉진하고, 유전체 의학의 발전을 가속화하고 있음을 시사한다. 앞으로도 클라우드 기술은 WGS 데이터 분석 분야에서 더욱 중요한 역할을 할 것으로 예상된다.구체적으로 AWS의 어떤 클라우드 서비스를 연구에 활용했는지 설명 부탁드린다.연구 과정에서 아마존 S3(Simple Storage Service)를 사용해 방대한 유전체 데이터를 안정적으로 저장하고 백업하며, 아마존 EC2(Elastic Compute Cloud) 가상 서버 환경에서 ICA(Illumina Connected Analytics)와 GATK(Genome Analysis Toolkit) 같은 첨단 생물정보학 도구를 구동하고 있다.또한 AWS Batch와 Lambda 서비스를 활용해 분석 파이프라인의 병렬화와 자동화를 구현했다. 이를 통해 대규모 컴퓨팅 자원을 효율적으로 분배함으로써 분석 속도가 크게 향상됐다. 더불어 아마존 세이지메이커(SageMaker)를 활용해 머신러닝과 딥러닝 모델을 신속히 훈련하고 배포하며, 복잡한 유전체 데이터에서 의미 있는 패턴을 발견하고 정밀한 예측 모델을 구축할 수 있었다.이러한 AWS 서비스의 활용은 온프레미스(On-premise) 환경 대비 인프라 확장성과 협업 효율성을 대폭 개선했다. 또 인적 오류를 최소화해 연구의 정확성과 신뢰성을 크게 높였다. 사용량 기반 과금 체계를 통해 비용 최적화가 가능하다는 점도 장점이다.실제 변이 콜링(Variant Calling) 파이프라인(Pipeline)에서는 기존 온프레미스 환경에서 1주일이 걸리던 작업을 AWS Batch와 같은 서비스를 활용해 배치 컴퓨팅 작업을 효율적으로 처리함으로써 최대 하루 반나절로 단축하는 성과를 보였다. 변이 콜링 파이프라인이란 DNA 시퀀싱 데이터를 참조 유전체와 비교해 유전적 변이를 찾아내고 이를 분석하는 일련의 생물정보학적 과정을 의미한다. AWS Batch와 같은 서비스를 활용해 배치 컴퓨팅 작업을 효율적으로 실행해, 변이 콜링 파이프라인은 DNA 시퀀싱 데이터를 참조 유전체와 비교하여 유전적 변이를 찾아내고, 이를 분석하는 일련의 생물정보학적 과정을 말한다.클라우드화는 분명 많은 장점을 제공하지만, 주의해야 할 점도 적지 않은 것으로 알고 있다.민감한 개인 유전체 정보를 다루는 만큼, 보안과 비용 문제가 주요 이슈로 떠오르고 있다. 강력한 보안 체계와 접근 제어는 필수적이며, 장기간 대규모 데이터를 저장하고 분석하는 데 필요한 예산도 면밀히 고려해야 한다. 또한 분석 소프트웨어나 데이터 형식이 표준화되지 않은 상태에서 협업이 진행되면 비효율성이 발생할 수 있다는 점도 유념해야 한다.AWS 솔루션이 이러한 문제를 방지하기 위해 어떤 방식으로 접근하고 있는지.AWS는 엄격한 의료 데이터 규정 준수를 통해 주목받고 있다. AWS는 미국 건강 보험 양도 및 책임에 관한 법률(HIPAA Health Insurance Portability and Accountability Act) 준수를 비롯해 ISO 27001, SOC 1, 2, 3 등 다양한 국제 보안 인증을 획득하며, 데이터 보안과 개인정보 보호에 대한 신뢰성을 입증받았다. 이를 통해 민감한 유전체 정보를 안전하게 관리하고 분석할 수 있으며, 연구자들이 혁신적인 연구를 수행하면서도 법적·윤리적 기준을 충족할 수 있도록 지원해 연구에만 전념할 수 있게 돕는다.마지막으로 전할 말씀이 있다면.WGS는 의료의 판도를 뒤흔들 혁신의 중심에 있다. 이제 AI, 빅데이터, 클라우드 기술과 결합해 정밀의료 시대를 앞당길 준비가 됐다. 그러나 이를 현실로 만들려면 인프라 구축, 제도 개선, 데이터 표준화, 전문 인력 양성이 반드시 뒷받침돼야 한다. WGS가 더 많은 생명을 살리고, 의료의 한계를 뛰어넘을 수 있도록 앞으로도 끝없이 도전하고 나아갈 것이다.
권혁진
2025.02.03