AI로 ‘진행성 침샘암 환자 생존예측 모델’ 구축
FOCUS
AI로 ‘진행성 침샘암 환자 생존예측 모델’ 구축
두경부암 저널 Oral oncology 게재
AI(인공지능)를 이용해 구경부암의 하나인 진행성 침샘암의 생존 예측 모델을 연구한 결과가 나왔다. 현재까지 조직병리학적 단계에 따라 예후를 예측한 연구는 많았지만, 암 환자의 나이, 성별, 치료법 등 다양한 임상적 특성을 고려한 생존 예측 모델 연구는 처음이다. 강동경희대학교병원 이비인후과 이영찬 교수팀(이영찬, 김태훈 교수)이 머신러닝 기법을 이용하여 침샘암의 생존 예측 모델을 연구해, 이중 가장 높은 예측과 낮은 오차를 보인 모델을 확인했다. 이를 통해 향후 침샘암을 비롯한 두경부암 환자의 맞춤형 치료에 도움이 될 것으로 보인다. 연구 결과는 두경부암 유명 저널인 Oral oncology에 게재됐다.
연구자. 이비인후과 이영찬 교수
FOCUS
AI로 ‘진행성 침샘암 환자 생존예측 모델’ 구축
두경부암 저널 Oral oncology 게재
AI(인공지능)를 이용해 구경부암의 하나인 진행성 침샘암의 생존 예측 모델을 연구한 결과가 나왔다. 현재까지 조직병리학적 단계에 따라 예후를 예측한 연구는 많았지만, 암 환자의 나이, 성별, 치료법 등 다양한 임상적 특성을 고려한 생존 예측 모델 연구는 처음이다. 강동경희대학교병원 이비인후과 이영찬 교수팀(이영찬, 김태훈 교수)이 머신러닝 기법을 이용하여 침샘암의 생존 예측 모델을 연구해, 이중 가장 높은 예측과 낮은 오차를 보인 모델을 확인했다. 이를 통해 향후 침샘암을 비롯한 두경부암 환자의 맞춤형 치료에 도움이 될 것으로 보인다. 연구 결과는 두경부암 유명 저널인 Oral oncology에 게재됐다.
연구자. 이비인후과 이영찬 교수
두경부암 중 하나로 침샘 있는 모든 부위에서 발생 가능
침샘암은 주타액선(침샘)과 소타액션(침샘)에서 발생하는 악성 종양을 말한다. 머리에서 가슴 윗부분까지의 영역에서 발생하는 두경부암 중 하나다. 침샘 자체가 귀밑, 혀밑, 턱밑부터 비강, 볼 점막, 구개, 혀를 비롯해 인두와 기관지까지 퍼져있어 다양한 부위에서 발생할 수 있다. 보통 초기 통증이나 증상이 없는데, 주타액선에서 발생한 경우 발생 부위에 덩어리가 생길 수 있고, 악성이 심한 경우 안면신경이나혀가 마비되기도 한다. 저악성도의 경우 국소 수술만으로 치료가 가능하며, 고악성도인 경우에는 방사선치료까지 동반해야 한다.
기존 예후 예측은 암환자의 개별 임상특성 반영 안돼
현재까지 조직병리학적 단계에 따라 침샘암의 예후를 예측하는 연구는 많이 보고되어 있다. 하지만 미국암연합위원회(American Joint Committee on Cancer, AJCC)가 분류하는 암의 병기 TNM stage으로만 생존율을 분석한 연구방법은 개별 환자에 대한 다른 임상적 정보(나이, 성별, 치료방법 등)를 고려하지 않아 적용에 한계가 있었다.
암환자 개별 임상정보 반영된 빅데이터로 연구
이에 이영찬 교수팀은 미국국립암연구소에서 제공하는 암환자 빅데이터(Surveillance Epidemiology and End Result. SEER data)를 바탕으로 머신러닝(Machine learning) 기법을 이용한 생존예측모델 연구를 진행했다. 2004년부터 2016년까지 총 607명의 T3 또는 그 이상의 병기를 가진 진행성 타액선(이하선) 암환자를 대상으로 연구를 진행했다. 암환자 빅데이터(SEER data)에는 진단 시 나이, 성별, 인종은 물론 TNM stage, 조직학적 분화도, 종양의 크기, 치료 방법, 생존기간 등이 포함되어 있다.
생존분석 모델에 머신러닝 기법 활용해 분석
머신러닝은 인공지능의 한 분야로 기계학습이라고도 부르는데, 주어진 데이터로부터 패턴이나 특성을 학습하여 새로운 데이터에 대한 작업을 수행할 수 있도록 하는 알고리즘 및 관련 분야를 일컫는다. 생존분석에는 여러 모델이 있는데 이영찬 교수팀은 네 가지 △Cox proportional hazard model (CoxPH), △conditional survival forest model (CSF), △random survival forest model (RSF), △DeepSurv model을 이용했다. 일차결과지표(Primary outcome)는 질병 진단일로부터 특정 질병 사망 사이의 기간을 기준으로 나타내었다.
CSF(conditional survival forest model) 가장 우수한 예측력 보여
연구결과 생존예측 모델의 정확도 지표를 나타내는 C-index 값에서는 각각 CSF (0.79), DeepSurv (0.79), CoxPH (0.78) 그리고 RSF (0.76) 모델 순으로 우수한 예측력을 보였다. 그리고 또 다른 비교 척도로 이용되는 Brier score(IBS) 값에서는 CoxPH (0.02), CSF (0.02) 그리고 DeepSurv (0.03) 모델 순으로 우수한 예측력을 나타냈다. 추가로 평균제곱근오차 (Root mean square error, RMSE)와 평균절대오차(Mean absolute error)를 이용하여 잔여수명과 실제수명과의 차이를 예측하였다. 여기에서는 CSF 그리고 RSF 모델에서 낮은 오차를 보이며 더 우수한 예측력을 나타냈다.
종합적으로 연구에서는 개발한 CSF모델은 가장 높은 예측 성능과 낮은 오차를 보여줬다. 비교적 드문 암에서도 머신러닝을 이용한 분석으로 기존의 예후 예측 방법보다 보다 정확한 분석이 가능할 것으로 기대된다. 강동경희대학교병원 이비인후과 이영찬 교수는 “이번 연구를 통해 환자 개별 임상정보가 적용되어 실제적인 생존 예측을 확인할 수 있는 기틀이 마련됐다”면서 “이를 통해 환자 개개인에게 맞는 맞춤형 치료 구현에 도움이 될 것으로 생각한다”고 말했다.
이번 연구는 과학기술정보통신부와 한국연구재단이 추진하는 바이오·의료기술개발사업(혁신형의사과학자공동연구)의 지원으로 수행되었으며 두경부암 관련 유명 저널인 Oral oncology (IF ; 5.337) online판에 게재됐다.