
건강검진 데이터·질병 유병·사망 정보 학습 트랜스포머 기반 AI 모델 개발서울대병원과 네이버가 건강검진 데이터를 활용해 개인의 생물학적 나이와 건강 위험을 함께 평가할 수 있는 인공지능(AI) 모델을 개발했다.
서울대병원 내분비대사내과 조영민·배재현·윤지완 교수팀과 네이버 디지털 헬스케어 랩 유한주·문성은 박사팀은 2003년~2020년까지 서울대병원 강남센터에서 건강검진을 받은 15만1천281명의 데이터를 분석했다.
데이터에는 신체계측·혈액·소변검사·폐기능 검사·질병 유무 및 사망 정보가 포함됐다. 연구 대상자는 혈당·혈압·콜레스테롤(지질) 수치에 따라 ▲정상군 ▲질환 전단계군 ▲질환군으로 분류됐다.
AI는 혈압·혈당·폐기능·콜레스테롤 등 여러 건강 지표를 통합 분석해 개인의 생물학적 나이(BA)를 예측하고, 이를 실제 나이(CA)와 비교해 두 값의 차이를 산출했다. AI는 학습된 대규모 데이터를 바탕으로 사용자의 건강 지표가 과거 생존율이 높았던 집단과 사망 위험이 컸던 집단 중 어느 쪽과 유사한지를 분석해 구체적인 예측값을 제시했다.
남녀 생리 차이를 반영코자 성별 모델을 각각 학습시켰다. AI는 건강 지표 변화가 질병 유무 및 사망 위험에 어떤 영향을 미치는지도 함께 학습했다. 이를 통해 단순히 생물학적 나이를 계산하는 데 그치지 않고, 현재의 건강 상태가 향후 생존율과 어떤 통계적 연관성을 가지는지를 평가할 수 있는 모델을 완성했다.
분석 결과, AI 모델은 정상군–질환 전단계군–질환군을 구분했다. 정상군은 생물학적 나이가 실제 나이보다 낮게, 질환군은 높게 나타났다. 혈당·혈압·지질 수치가 악화할수록 BA–CA 갭이 커졌으며, 심혈관질환이나 암이 있는 경우에도 이 갭이 유의미하게 증가했다.
남성의 경우 비건강군이 건강군보다 생존율이 통계적으로 유의하게 낮았다. 여성에서도 유사한 경향이 확인됐다. 반면, 기존의 생물학적 나이 예측 모델은 이러한 차이를 일관되게 구별하지 못했다.
참고로 생물학적 나이(BA)는 유전‧생활습관‧환경‧질병 이력 등 요인을 종합해 신체의 실제 노화 정도를 수치로 표현한 지표다. 실제 나이(CA)보다 생물학적 나이가 낮으면 건강 상태가 양호함을 의미한다. 반대로 높으면 노화가 빠르거나 질병 위험이 클 수 있다.
하지만 기존 생물학적 나이 예측 모델은 주로 건강한 사람의 데이터를 기반으로 만들어졌다. 때문에 만성질환자에게 적용하기 어렵고 사망 위험을 반영하지 못한다는 한계가 있었다.
조영민 내분비대사내과 교수는 “연구는 질병 유병 상태와 사망 정보를 동시에 학습한 첫 트랜스포머 기반 생물학적 나이 예측 모델”이라며 “서울대병원의 임상 데이터와 네이버의 AI 기술력이 결합해 의료 전문성과 기술이 함께 만든 성과”라고 밝혔다.
한편, 연구 결과는 의료정보학 분야의 국제학술지 ‘Journal of Medical Internet Research’ 최근호에 게재됐다.
서울대병원 내분비대사내과 조영민·배재현·윤지완 교수팀과 네이버 디지털 헬스케어 랩 유한주·문성은 박사팀은 2003년~2020년까지 서울대병원 강남센터에서 건강검진을 받은 15만1천281명의 데이터를 분석했다.
데이터에는 신체계측·혈액·소변검사·폐기능 검사·질병 유무 및 사망 정보가 포함됐다. 연구 대상자는 혈당·혈압·콜레스테롤(지질) 수치에 따라 ▲정상군 ▲질환 전단계군 ▲질환군으로 분류됐다.
AI는 혈압·혈당·폐기능·콜레스테롤 등 여러 건강 지표를 통합 분석해 개인의 생물학적 나이(BA)를 예측하고, 이를 실제 나이(CA)와 비교해 두 값의 차이를 산출했다. AI는 학습된 대규모 데이터를 바탕으로 사용자의 건강 지표가 과거 생존율이 높았던 집단과 사망 위험이 컸던 집단 중 어느 쪽과 유사한지를 분석해 구체적인 예측값을 제시했다.
남녀 생리 차이를 반영코자 성별 모델을 각각 학습시켰다. AI는 건강 지표 변화가 질병 유무 및 사망 위험에 어떤 영향을 미치는지도 함께 학습했다. 이를 통해 단순히 생물학적 나이를 계산하는 데 그치지 않고, 현재의 건강 상태가 향후 생존율과 어떤 통계적 연관성을 가지는지를 평가할 수 있는 모델을 완성했다.
분석 결과, AI 모델은 정상군–질환 전단계군–질환군을 구분했다. 정상군은 생물학적 나이가 실제 나이보다 낮게, 질환군은 높게 나타났다. 혈당·혈압·지질 수치가 악화할수록 BA–CA 갭이 커졌으며, 심혈관질환이나 암이 있는 경우에도 이 갭이 유의미하게 증가했다.
남성의 경우 비건강군이 건강군보다 생존율이 통계적으로 유의하게 낮았다. 여성에서도 유사한 경향이 확인됐다. 반면, 기존의 생물학적 나이 예측 모델은 이러한 차이를 일관되게 구별하지 못했다.
참고로 생물학적 나이(BA)는 유전‧생활습관‧환경‧질병 이력 등 요인을 종합해 신체의 실제 노화 정도를 수치로 표현한 지표다. 실제 나이(CA)보다 생물학적 나이가 낮으면 건강 상태가 양호함을 의미한다. 반대로 높으면 노화가 빠르거나 질병 위험이 클 수 있다.
하지만 기존 생물학적 나이 예측 모델은 주로 건강한 사람의 데이터를 기반으로 만들어졌다. 때문에 만성질환자에게 적용하기 어렵고 사망 위험을 반영하지 못한다는 한계가 있었다.
조영민 내분비대사내과 교수는 “연구는 질병 유병 상태와 사망 정보를 동시에 학습한 첫 트랜스포머 기반 생물학적 나이 예측 모델”이라며 “서울대병원의 임상 데이터와 네이버의 AI 기술력이 결합해 의료 전문성과 기술이 함께 만든 성과”라고 밝혔다.
한편, 연구 결과는 의료정보학 분야의 국제학술지 ‘Journal of Medical Internet Research’ 최근호에 게재됐다.
댓글목록
등록된 댓글이 없습니다.