사이언스

AI 대(對) 의사…진료 분야별 승자 살펴보니

미국 실리콘밸리 엘카미노병원
AI 도입해 낙상환자 39% 줄어
외과 절개도 로봇이 앞서기 시작

뇌암·피부암·안과 진단은 백중세
일반적인 진단에선 인간이 우세

미국 메릴랜드대 의대 로봇 외과 의사인 STAR가 돼지 지방과 근육, 피부조직을 정교하게 절개한 모습. /미 메릴랜드대 제공

미국 캘리포니아 실리콘밸리에 있는 엘카미노병원은 인공지능(AI) 환자 관리 시스템을 도입한 지 6개월 만에 낙상환자 수를 39%가량 줄었다. 병원이 개발한 AI는 전자의무기록과 병실 환자와 연결된 실시간 추적 센서에 나타난 정보를 바탕으로 환자 낙상 가능성을 예측한다. 수술 상처에 따라 환자가 침대의 비상벨을 누르고 불을 켜는 빈도와 패턴을 학습해뒀다가 센서에 조금이라도 이상이 포착되면 ‘2308호 환자가 침대에서 떨어질 위험이 있다’는 메시지를 간호사에게 전달한다.

IBM의 AI 프로그램 ‘왓슨’의 활약 덕에 의료 분야의 AI 도입은 사실상 초읽기에 들어갔다. 병원에서 환자 관리를 위한 AI의 도입은 대체로 환영받는 분위기지만 의사 사회는 즐거워할 수만은 없어 보인다. 과연 AI가 인간 의사의 일자리를 얼마나 빼앗아갈지 관심사로 떠올랐다.

◆급성심근경색·자폐증 예측 독보적

의료 분야에서 AI가 인간을 대체할 것이란 전망이 제기된 건 지난해다. 하지만 불과 1년 새 곳곳에선 인간 의사와 AI 간 실력 겨루기가 진행되고 있다. 미국 전기전자공학회(IEEE)가 발행하는 과학기술전문지 스펙트럼은 최신호에서 인간 의사와의 경쟁에서 AI가 대체로 우세하다는 평가를 내놨다.

심근경색과 같은 심장질환 예측과 자폐증 진단에서 AI는 이미 인간을 추월했다. 영국 노팅엄대 연구진은 기계학습을 하는 AI가 10년 내 심근경색에 걸릴 환자를 인간 의사보다 더 잘 찾아냈다는 연구 결과를 국제학술지 ‘플로스원’에 지난 5월 발표했다.

심장 전문의들은 고혈압과 콜레스테롤, 연령, 흡연 여부와 비만 여부를 놓고 심장 질환에 걸릴 위험을 경고한다. 그럼에도 불구하고 전체 심장질환 환자의 50% 이상은 이런 경고를 받지 못하고 있다. 연구진은 2005~2015년 영국에 거주하는 37만8256명의 의료기록과 처방전, 환자 방문 수, 연구 결과를 AI에게 학습시켰고 실제 심근경색이 온 7404명의 환자 가운데 4998명을 정확히 예측해냈다. 인간 의사가 예측해낸 환자보다 355명 더 많은 수치다.

소아 자폐증 예측과 진단에서도 AI는 굳건한 자리에 올랐다. 1990년대 후반 의학계에는 자폐 스펙트럼 장애(자폐증)를 가진 청소년의 뇌 부피가 정상 청소년보다 크다는 결과가 보고됐다. 미국 노스캐롤라이나대 연구진은 AI가 딥러닝을 통해 생후 6개월쯤 자폐증으로 발전할 가능성이 있는 미세한 뇌 부피 변화를 조기에 포착하는 방법을 개발했다. 현재 12개월짜리 아이를 대상으로 하는 자폐증 진단 정확도가 50%에 머무는 데 반해 AI의 진단 정확도는 81%에 이른다.

외과 절개에서도 로봇과 결합한 AI가 인간을 앞서기 시작했다. 오랜 경험과 숙련된 솜씨를 가진 인간 외과 의사보다 주변 피부조직을 손상시키지 않고 수술 부위만 정확히 절개하는 수술로봇 기술이 등장했다. 미국 메릴랜드대 의대 연구진이 개발한 스마트조직자동로봇(STAR)이라는 수술용 로봇은 적외선 카메라와 일반 카메라로 수술 부위를 보면서 정밀하게 피부조직을 잘라낸다. 가짜 종양을 잘라내는 실험에서 종양 가장자리에서 정확히 4㎜ 떨어진 부위만 떼어낼 정도로 정확도가 높았다.

◆일반 진단은 인간이 아직 앞서
아직까지 인간과 AI가 우열을 가리기 힘든 분야도 있다. 뇌암과 피부암, 안과 진단 분야다. IBM과 뉴욕게놈센터 연구진은 왓슨이 76세의 교모세포종(뇌종양)을 앓는 환자의 게놈(유전체)을 분석하고 2300만 건의 논문 검색을 통해 10분 만에 치료법을 제시했다는 연구 결과를 지난 8월 신경유전학 저널에 소개했다. 같은 환자의 게놈을 받아든 뉴욕게놈센터 연구자들은 160시간 만에 치료 방안을 내놨다. 하지만 전문가들은 왓슨이 시간상 앞섰을지는 몰라도 이것이 AI의 승리를 의미하지 않는다고 평가했다. 인간 의사들은 이 환자에게서 나타난 두 개의 유전자 변이를 확인했고 임상시험에 들어간 약물 조합 치료를 권했다. 반면 왓슨은 임상시험을 권장하지 않았다. 환자를 임상시험에 참여시켜 더 오래 살게 했다면 인간 의사들의 판단이 더 옳았을 것이란 분석이 나왔다.

피부암 진단에서도 아직 우열을 확인하지 못했다. 미국 스탠퍼드대 연구진은 피부암을 진단하는 인셉트V3라는 AI를 개발해 128만 장에 이르는 이미지를 학습시켰다. 국제학술지 네이처는 지난 1월 안과 의사 21명으로 구성된 팀과 13만 장의 피부 질환 사진을 보고 피부암을 골라내는 실력을 겨룬 실험에서 AI가 피부병과 양성종양을 구별하는 능력에서만 안과 의사보다 더 나았다는 결과를 소개했다.

일반적인 진단에서는 인간이 AI보다 훨씬 우세한 편이다. 미국 하버드대 의대 연구진은 지난해 온라인 진단 앱(응용프로그램)과 서비스를 통해 자신의 증상을 알아본 환자 가운데 34%만이 자신의 병을 정확히 알아냈다는 결과를 소개했다. 반면 동일한 증상 정보를 받아본 의사 234명이 내린 진단의 정확도는 72%에 이른다. 환자의 말만 듣고 병을 진단하는 분야에선 여전히 인간의 귀와 판단이 정확하다는 결과인 셈이다.

박근태 기자 kunta@hankyung.com

ⓒ 한경닷컴, 무단전재 및 재배포 금지