선종은 장 점막에 비정상적으로 자라는 혹 덩어리인 용종의 한 종류다. 진행성 선종의 크기가 1㎝ 미만일 때 암세포가 발견될 확률은 1% 수준이지만 2㎝ 이상이면 10%, 3㎝ 이상이면 40~50%에 달한다. 진행성 선종을 그냥 내버려 두면 5~10년 후 암으로 진행할 가능성이 커 '대장암의 씨앗'으로 불린다.
연구팀은 빅데이터 분석을 위한 기초 자료로 환자의 나이와 성별, 검사 수치 등 정형화된 자료와 영상검사 판독 결과 등 서술형 진료기록을 모두 활용했다. 이를 토대로 연구팀은 선종이 발견된 환자와 그렇지 않은 환자를 각각 분석해 나이와 성별, 흡연력, 음주 빈도, 아스피린 복용 여부 등 위험인자 5가지를 특정해 지수화하는 데 성공했다. 새로 만든 모델의 유효성을 평가한 결과 적중률은 71.6%였다. 기존에 쓰던 아시아-태평양 예측모델 적중률(67.8%)보다 정확했다.
삼성서울병원 연구팀, 환자 5만명 빅데이터 분석
나이·성별·흡연·음주·아스피린 등 위험요인 5개 특정
최종값 -4.195 기준으로 저·고위험군 분류
적중률 71.6%로 기존 모델 대비 신뢰도 높아
고위험군이면 대장 내시경 검사 등 적극 관리해야
"대장암으로 이어질 수 있는 선종 예방하는 데 도움"
연구진은 예측모델로 자가진단해 고위험군에 속하면 조기에 대장 내시경 검사를 받는 등 적극적으로 관리할 필요가 있다고 조언했다. 이풍렬 교수는 “수치화한 의료기록을 빅데이터 기술로 분석해 위험예측 모델을 만들었다는 데 의의가 있다”며 “대장암으로 이어질 수 있는 대장 선종 발생 위험이 어느 정도인지 가늠하고 효과적으로 예방하는 데 도움이 될 것”이라고 말했다.
이번 연구는 미국 공공과학도서관이 발행하는 국제학술지인 플로스원(PLoSONE) 최신호에 실렸다.
다음은 삼성서울병원이 개발한 예측 모델이다.
예측모델= -8.39 + 0.0154*흡연 기간(년) + 0.1003*음주빈도(음주 X=0 / 주 1회=1 / 월 2~3회=2 / 주 1~2회=3 / 주 3~4회=4 / 주 5~6회=5 / 매일=6) - 0.5772*아스피린 복용(정기 복용=1 / 미복용=0) + 0.4098*성별(남=1 / 여=0) + 0.0736*나이(년)
김선영 기자 kim.sunyeong@joongang.co.kr