원문: Advancing precision health discovery in a genetically diverse health system
게재지: Cell (2026)
DOI: https://doi.org/10.1016/j.cell.2026.03.007


한 줄 요약

UCLA ATLAS 바이오뱅크의 93,936명 참가자를 5개 대륙 계통과 36개 세분화 조상 집단으로 분류하고, 유전체-전자건강기록(EHR) 통합 분석을 통해 조상 집단별 질병 위험의 차이, 기존에 보고되지 않은 유전자-질환 연관성, 그리고 세마글루타이드(semaglutide)의 체중 감량 효과가 유전적 배경에 따라 달라진다는 것을 밝혔다.


정밀의학은 왜 ‘유럽인 중심’일까?

바이오뱅크는 대규모 인구 집단의 유전 정보와 건강 데이터를 연결하여 질병의 원인과 치료 표적을 찾는 핵심 자원이다. UK Biobank, All of Us, FinnGen 같은 대형 바이오뱅크들이 수많은 유전적 발견을 이끌어냈다. 그러나 문제가 있다. 대부분의 바이오뱅크 참가자가 유럽계(European, EUR) 조상에 집중되어 있다는 것이다.

다유전자 점수(polygenic score, PGS)는 EUR 인구에서 개발되어 비유럽계 인구에서는 예측력이 크게 떨어진다. 임상적으로 의미 있는 희귀 변이 데이터베이스도 EUR 편향이 심하다. 같은 유전 변이라도 조상 배경에 따라 질병 위험이 달라질 수 있는데, 이를 체계적으로 연구할 수 있는 다인종 바이오뱅크가 부족했다. 이 연구는 미국에서 가장 인종적으로 다양한 도시 중 하나인 로스앤젤레스의 UCLA 의료 시스템에서 구축된 ATLAS 바이오뱅크를 활용하여 이 문제에 정면으로 도전한다.


어떻게 연구했나?

항목 내용
참가자 수 93,936명
유전체 데이터 배열 유전형 분석 92,164명 + 전장엑솜시퀀싱(WES) 61,797명
전자건강기록 2013년부터, 평균 8.6년 추적, 7,173만 건 검사 결과
대륙 계통 분류 EUR(62,902), AMR(12,822), EAS(8,080), AFR(4,061), SAS(1,761), 미분류(2,538)
세분화 조상 집단 36개 클러스터 (IBD 기반)
주요 분석 PheWAS, ExWAS, PGS 성능 평가, 약물유전체학(세마글루타이드)

ATLAS의 강점은 단일 의료 시스템 내에서 다양한 조상 집단을 포괄한다는 것이다. 서로 다른 병원 시스템 간의 임상 관행 차이로 인한 교란을 줄이면서, 유전적 배경에 따른 순수한 차이를 비교할 수 있다. 참가자의 32%가 비유럽계로, 기존 바이오뱅크 대비 높은 다양성을 갖는다.


조상 집단에 따라 질병 부담이 다르다

36개 세분화 조상 집단을 대상으로 1,253개 질병 표현형(phecode)의 유병률을 비교했다. 결과는 같은 대륙 계통 안에서도 세부 집단 간에 뚜렷한 차이가 있음을 보여준다.

발견 세부 내용
필리핀계 비타민 B 복합체 결핍 위험 가장 낮음 (OR = 0.50), 담낭 콜레스테롤증 위험 가장 높음 (OR = 4.3)
이란계 유대인 녹내장 위험 상승 (OR = 1.9), 기존 미보고
이란·아슈케나지 유대인 방광암 위험 공통 상승
멕시코계·남미계 미국인 호르몬 부작용 위험 일관되게 상승 (OR = 1.3~1.9)
EAS 전체 수면무호흡증 위험 낮음 (OR = 0.67)
AMR 전체 양극성 장애 위험 낮음 (OR = 0.47)

이러한 차이는 유전적 요인뿐 아니라 사회경제적 지위(SES)와 의료 접근성의 영향도 받는다. 연구진은 역확률가중법(IPW)과 지역박탈지수(ADI) 보정을 적용했으며, 대부분의 연관성이 SES 보정 후에도 유지되었다.


유전체 전체를 훑어 찾아낸 새로운 연관성 — PheWAS

84,110명을 대상으로 조상 집단별 표현형 전체 연관 분석(PheWAS)을 수행하여, 776개 표현형에 걸쳐 19,431개의 변이-표현형 연관성을 발견했다. 이 중 5,772개가 가장 보수적인 본페로니 기준을 통과했다.

기존에 보고되지 않은 주요 발견들은 다음과 같다.

유전자/변이 질환 발견 집단 의미
FN3K rs7208565-T 장 이당류분해효소 결핍 EUR, AMR FN3K는 당화 단백질을 인산화하여 최종당화산물(AGE) 형성을 방지. 기존에 제2형 당뇨와 연관 보고
STARD7 rs17419569-C 천식 멕시코계 미국인 STARD7 발현 감소가 기도 과민반응 증가와 연관
GPX7/SHISAL2A rs74744741-C 위식도역류질환(GERD) 멕시코계 미국인 GPX7은 바렛식도 관련 발암 과정에 연관
DPP6 rs115750084-G 주요우울장애 AFR 시냅스 신호전달과 신경발달 장애에 관련
UBR5 결실 편두통 멕시코계 미국인 E3 유비퀴틴 리가아제, 신경염증과 신경발달 증후군에 관여

83.8%의 연관성이 단일 조상 집단에서만 유전체 전체 유의성을 보였지만, 더 관대한 기준을 적용하면 54.7%에서 교차 조상 지지가 관찰되었다. 즉, 많은 연관성이 특정 집단에서 ‘처음 발견’되었을 뿐, 다른 집단에서도 같은 방향의 효과를 보인다.


다유전자 점수(PGS)의 한계 — 비유럽계에서 예측력 급감

다유전자 점수는 수백~수천 개의 흔한 변이 효과를 합산하여 개인의 질병 위험을 예측하는 도구다. EUR에서는 평균적으로 주요 질환 진단 환자의 18.6%가 상위 10% PGS에 속하며, 제1형 당뇨의 경우 41%까지 올라갔다. 그러나 비유럽계 인구에서는 이 예측력이 현저히 감소했다.

질환 EUR 상위 10% PGS 내 환자 비율 비EUR에서의 변화
제1형 당뇨 41% 크게 감소
관상동맥 죽상경화증 ~25% 감소
유방암 ~20% 감소
제2형 당뇨 ~20% 감소

이는 PGS가 주로 EUR 대상 게놈연관분석(GWAS)에서 개발되었기 때문이다. 조상 집단 간 연관불균형(linkage disequilibrium, LD) 패턴이 다르고, 대립유전자 빈도도 달라서, EUR에서 식별된 위험 변이가 다른 인구에서는 같은 신호를 전달하지 못한다. 이 결과는 현재의 PGS를 비유럽계 환자에게 그대로 적용하면 건강 불평등을 오히려 악화시킬 수 있음을 경고한다.


희귀 변이의 ‘유럽 편향’ — 임상 데이터베이스의 맹점

ATLAS의 전장엑솜시퀀싱 데이터에서 1,150만 개 이상의 자가체 변이가 확인되었다. ClinGen에 등록된 병원성/병원성 가능(P/LP) 변이를 분석한 결과, 임상적으로 중요한 유전 변이 데이터베이스에 심각한 EUR 편향이 존재했다.

분석 항목 결과
ACMG 유전자 내 ClinGen P/LP 변이 EUR에서 압도적으로 많이 등록
AFR 참가자 가장 많은 희귀 기능상실(LOF) 및 미스센스 변이 보유
컴퓨터 예측 도구 활용 EUR 편향 완화, 미보고 조상 특이적 연관성 발견

연구진은 ClinGen 변이 대신 컴퓨터 예측 병원성 변이(predicted dLOF, dMIS)를 활용하여 EUR 편향을 줄였다. 이를 통해 기존에 보고되지 않은 연관성을 발견했다.

유전자 질환 발견 집단
ANKZF1 말초혈관질환 AFR
CLN3 낭성 신장 질환 AMR
DDHD2 연하곤란(삼킴장애) AFR
AK7 비류마티스성 승모판 장애 EAS
KIF2B 신염/신장질환 중국·한국계
HNRNPA1L2 유방 결여 북유럽계

특히 ANKZF1과 말초혈관질환의 연관성은 최근 실험적 증거로도 뒷받침되었으며, HNRNPA1L2BRCA2에서 약 20 Mb 떨어진 별도의 유전자좌(locus)로, 유방암과의 새로운 연관성을 제시한다.


세마글루타이드, 조상에 따라 효과가 다르다

ATLAS의 종단적 EHR 데이터를 활용한 약물유전체학 분석은 이 연구의 가장 실용적인 성과 중 하나다. 세마글루타이드(GLP-1 수용체 작용제)는 ATLAS에서 가장 많이 처방된 약물이었으며, 7,340명의 사용 데이터가 분석되었다.

요인 체중 감량에 대한 영향
용량 높을수록 감량 효과 ↑ (효과 크기 = -1.0)
투여 경로 경구보다 피하주사가 효과 ↑ (효과 크기 = 2.2)
성별 남성이 약간 더 큰 효과 (효과 크기 = 3.0)
연령·초기 BMI 유의한 영향 없음
조상 배경 AMR과 EAS에서 EUR 대비 체중 감량 속도 느림

AMR 인구에서의 감량 효과 감소는 최근 단일 시점 분석과도 일치하며, EAS에서도 유사한 경향이 확인되었다. AFR에서는 효과 감소 방향은 같았으나 통계적 유의성에 도달하지 못했다.

유전적 요인 측면에서, 제2형 당뇨 PGS가 높을수록 세마글루타이드에 의한 체중 감량이 적었다. 유전자 수준 분석에서는 PTPRU(단백질 타이로신 포스파타아제 수용체 U형) 변이가 체중 감량과 유의하게 연관되었다(P_Bonferroni = 7.6 × 10⁻³). PTPRU 활성이 높으면 체중 감량이 적었고, 세마글루타이드 치료가 PTPRU를 하향 조절한다는 혈청 프로테오믹스 데이터와도 일치한다. 이 유전자는 체중 감량이나 대사 기능과의 기존 연관성이 보고된 적이 없어, 새로운 약물 반응 바이오마커 후보로 제시되었다.


이 연구가 말해주는 것

다양성이 발견을 낳는다

ATLAS는 필리핀계 유전형 분석 코호트로는 알려진 것 중 최대 규모(1,438명)이며, 아슈케나지 유대인 클러스터(14,261명)도 기존 단일 연구 코호트의 2.8배에 달한다. 이러한 규모 덕분에 기존 바이오뱅크에서 발견할 수 없었던 집단 특이적 연관성이 드러났다. 유전 연구의 다양성 확대가 단순히 형평성의 문제가 아니라, 과학적 발견의 질을 높이는 전략임을 보여준다.

정밀 약물 처방을 향한 한 걸음

세마글루타이드의 효과가 조상 배경과 유전적 변이에 따라 달라진다는 발견은, 향후 약물 처방에서 환자의 유전적 배경을 고려해야 할 필요성을 시사한다. 특히 PTPRU는 약물 반응을 예측하는 새로운 표적으로, 개인 맞춤형 비만 치료의 가능성을 열어준다.


연구의 한계

  • EHR 기반 표현형의 한계: 전자건강기록은 진단 코드에 기반하므로, 실제 질병 발생이 아닌 ‘진단 받을 위험’을 측정한다. 의료 접근성 차이가 유병률 추정에 영향을 줄 수 있다.
  • 컴퓨터 예측 변이의 불확실성: 희귀 변이의 병원성을 예측하는 데 9개 도구의 합의를 사용했으나, 예측 도구 자체에 조상 편향이 존재할 수 있다. 소규모 조상 집단에서는 예측 손상 변이 수의 비교가 불안정할 수 있다.
  • 세마글루타이드 분석의 한정성: 단일 GLP-1 수용체 작용제만 분석했으며, 다른 GLP-1RA(리라글루타이드, 티르제파타이드 등)와의 비교는 수행되지 않았다. GWAS에서는 유의한 유전자좌를 발견하지 못하여, 유전자 수준 분석으로 전환했다.
  • 독립 코호트 검증의 제한: 새로 보고된 21개의 PheWAS 및 ExWAS 발견 중 16개(76%)가 독립 바이오뱅크에서 명목 수준의 재현에 성공했으나, 완전한 유전체 전체 유의성 수준의 재현은 더 큰 코호트가 필요하다.

유전자는 우편번호를 모른다, 하지만 조상은 기억한다

같은 질병이라도 누구에게 더 위험한지, 같은 약이라도 누구에게 더 잘 듣는지는 유전적 배경에 따라 달라질 수 있다. 그런데 우리가 가진 의학 지식의 대부분은 특정 인구 집단에서만 쌓여 왔다. 이 연구는 한 도시의 한 병원 시스템 안에서도, 조상의 다양성을 존중하면 그만큼 더 많은 것을 발견할 수 있다는 것을 보여준다. 정밀의학이 진정으로 ‘정밀’해지려면, 모든 사람의 유전자가 같은 무게로 연구되어야 한다.