빠른 속도로 진화하는 AI가 의료 영역에도 영향을 미치면서 최근 몇 년 새 의료종사자 사이에서 떠오른 최대 화두다.
미 오픈AI가 개발한 대화형 AI 챗봇인 챗GPT가 지난해 미국 의사면허시험(USMLE)에서 약 60%의 정답률을 기록하며 가뿐히 시험을 통과했다는 소식이 전해진 바 있다. 미국 의료 영역에 AI가 도입되면 연간 4조5000억 달러(약 6060조 원)에 달하는 전체 의료 지출에서 2000억~3000억 달러(약 270조~400조 원)를 절감할 수 있다는 예상도 나온다. AI는 병력 관리 등 의료 행정 간소화에 도움이 될 뿐만 아니라 의사 소견서 작성과 X레이ㆍMRI 판독, 심박수ㆍ산소수치과 같은 데이터 모니터링 등 이미 다양한 분야에 활용되고 있다.
하지만 미 하버드 의대 로버트 슈멀링 교수는 지난달 27일 ‘하버드 헬스 퍼블리싱’에 실은 글을 통해 “의료 전문가의 지도ㆍ감독 없이 AI 진료에 의존하는 것은 시기상조”라고 지적했다. 하버드 헬스 퍼블리싱의 수석 교수 편집자이기도 한 그는 지난해 챗GPT와 의사의 의료상담 내용을 전문가가 비교 평가한 결과 답변의 품질과 공감도 측면에서 챗GPT가 훨씬 우수한 것으로 나타났다는 연구 결과를 정면으로 반박하면서 이렇게 주장했다.
지난해 미 샌디에이고 캘리포니아대(UCSD) 퀄컴연구소 연구팀은 온라인 커뮤니티 레딧의 ‘애스크 닥스(Ask Docs)’ 게시판에 올라온 의료 질문과 답변 195개를 선택한 뒤 같은 질문을 챗GPT에 제시해 답변을 받았다. 애스크 닥스는 커뮤니티 회원이 의료 관련 질문을 올리면 의사 면허를 가진 이들이 답변을 다는 온라인 카페로, 연구팀은 양쪽 답변을 세 명의 의료 전문가 패널에게 블라인드 형식으로 보여주고 답변의 품질과 공감도 등을 평가하게 했다.
슈멀링 교수 “답변 정확성 평가 빠져”
슈멀링 교수가 내린 결론은 “정확성에 대한 확실한 검증과 의료 전문가 감독 없이 환자들이 AI 답변에 의존하는 것은 시기상조”라는 것이다. 그는 “챗GPT도 여기에 동의한다. 의학 질문에 의사보다 더 잘 대답할 수 있는지 물어봤더니 ‘아니오’란 답이 돌아왔다”고 했다.
이코노미스트 “AI가 결국 진료하겠지만…”
우선 의료 빅데이터 확보의 안전성과 관련된 문제다. AI 답변의 정확도를 높이기 위해서는 환자의 다양성을 반영한 대규모 데이터 학습이 필요한데, 현재 의료 데이터는 파편화돼 있고 엄격한 규제에 따라 통제된다. 이코노미스트는 “의료 데이터가 자유롭게 이동할 수 있는 안전한 방법을 찾는 것이 도움이 될 것”이라고 지적했다.
또 비용 절감보다는 의료 서비스 개선에 초점이 맞춰진 현 의료 시스템에 새로운 AI 시스템이 도입될 경우 비용과 복잡성이 증가하면서 환자와 의료진의 저항에 부딪힐 가능성이 높다는 점도 고려해야 할 이슈라고 매체는 지적했다. 이코노미스트는 “이처럼 엄청난 장애물이 있지만 의료 분야에서 AI를 사용할 경우 얻을 수 있는 방대한 이점이 있기 때문에 이를 극복해야 할 필요성은 분명하다”고 강조했다.
국내외 상당수 의료인들은 챗GPT에서 제시되는 진단을 과신해서는 안 된다고 경고한다. 논문이나 보고서 등에서 발췌한 내용을 적당히 짜깁기해서 내놓는 결과에 의료 전문지식이 없는 사람들이 현혹되면 위험해질 수 있다는 것이다.