복잡한 외과 수술을 시행할 AI 의사가 개발될 수 있을까?

7 minute read

에세이 제목: 복잡한 외과 수술을 시행할 AI 의사가 개발될 수 있을까?

[에세이 도입부- 질문하기 ] “과연 현재의 컴퓨터 또는 소프트웨어로 무인 수술 로봇을 구현할 수 있을까?”

인공지능(AI, Artificial Intelligence)은 인간의 자연적인 지능과는 달리 인간을 모방하여 컴퓨터가 발현하는 지능으로, 전산학에서는 기계지능(Machine Intelligence)이라고 불린다.

약 1950년대부터 인공지능이 사용되기 시작했으며 비록 암흑기가 있었지만 최근 GPU 기술의 발달과 함께 인공지능 능력도 기하급수적으로 지속 발달했다. 우리는 알파고와 국내에서 개발된 한돌이 프로기사 이세돌을 이기는 세상에 살고 있다.

바둑의 경우만 하더라도 폭발적인 조합의 경우를 계산해주어야 하는데 알파고는 딥러닝과 강화학습을 함께 적용시킴으로써 해결했다. 앞서 말한 GPU기술의 발달로 폭발적인 계산을 감당할 수 있을 뿐 아니라 행여 매우 큰 컴퓨팅 리소스를 필요로 하는 인공지능 기술이더라도 최근 4차 산업 혁명시대에 봉착하면서 연구가 활발히 진행되어 여러 수학적인 이론들이 많이 수립되었으니 그 둘의 시너지로 이제 두려울 것이 없는 것이다.

헬스케어 분야에서는 어떨까? 펍메드나 구글 스칼라에서 찾아보면 1980년대 논문에도 인공지능을 이용한 질병 진단과 그에 따른 치료와 소위 말하는 맞춤의학(Precision Medicine) 논문을 심심치 않게 찾아볼 수 있다. [1]

지금으로부터 50년전인 지난 1966년, 미국 매사추세츠공대(MIT)에 재직하던 조셉 와이젠바움 박사는 ’엘리자’란 여성 상담사를 고용했다. 이 여성은 전화로 상담을 청해오는 사람들에게 친절하게 응대해줬다.

엘리자는 차츰 탁월한 정신과 치료사로 명성을 얻기 시작했다. 당시 엘리자가 주고 받은 대화는 이런 식이었다.

환자: 전 항상 침울해요. 엘리자: 침울하다구요? 안됐군요. 환자: 제 남자 친구가 이 곳을 소개해줬어요. 엘리자: 당신 남자 친구가 소개해줬다구요? 환자: 도움이 필요해요. 엘리자: 도움이 필요하다구요? 어떤 도움이 필요하죠?

사람들은 자신을 이해해주고, 얘기를 잘 들어주는 엘리자에 푹 빠지기 시작했다. 그러자 오히려 와이젠바움이 당황했다. 엘리자는 컴퓨터 과학자였던 와이젠바움이 개발한 일종의 채팅봇이었기 때문이다. 사람들의 반응에 놀란 와이젠바움은 결국 엘리자를 폐쇄했다. 실제로 엘리자가 나눈 대화를 보면 특별한 것 없다는 걸 알 수 있다. ‘말꼬리’를 잡는 방식으로 대화를 이어나간다고 있는 것. 그럼에도 불구하고 사람들은 엘리자를 너무나 사랑했다. 자기 얘길 잘 들어주고, 공감해줬기 때문이다.[2]

뿐만 아니라, 1970년대에도 스탠포드에서 개발된 MYCIN은 항생제 마이신과 동명으로, 혈액에 박테리아 감염이 되었는지 여부를 진단하는 인공지능이었다. MYCIN은 당시 의과대 교수진들의 처방보다 정확하다는 실험 보고가 있다.[1][3]

무엇보다도 최근 IBM의 왓슨(Watson)이 암진단·치료법에 사람의 음성인식 기능(NLP)을 활용해 많은 주목을 받았다. 현재도 상용화 되지 않았을 뿐, 여러 인공지능 콘테스트가 열리고 있으며, 구글에서 개발한 오픈 소스인 텐서플로우(TesorFlow)를 기반으로 MRI·Xray·CT·초음파 등 영상자료의 인공지능을 이용한 각종 암진단 논문과 회사들이 쏟아져 나오고 있다.

단연 진단 뿐만 아니라 의사의 손으로 직접 수술을 하는 것 보다 더 정확하게 수술 할 수 있다는 다빈치나 나비오와 같은 인공지능 로봇을 끼고 수술하는 일도 이제 흔한 일이 되었다. 이처럼 수술로봇은 영역을 넓혀가며 수술실에서 의료 질을 높이는 데 일조하고 있지만 지금까지는 의사들의 수술을 보조하는 역할에 그쳤다. 하지만 미래에는 보조를 넘어 로봇이 의사 지시없이 독자적으로 수술하는 무인 수술 로봇의 도입을 예고하고 있다.

그렇다면 복잡한 외과 수술을 시행할 AI 의사도 개발될 수 있을까?

[에세이 본론-1부 ] “현재의 인공지능/컴퓨터 기술로 불가능한 문제인가?”

실제로 해외에서는 무인 수술 로봇에 대한 연구가 한창 진행 중이다. 미국의 국립아동병원(Children’s National Medical Center)이 개발 중인 STAR(스마트조직 자율로봇, Smart Tissue Autonomous Robot)는 카메라와 기계 센서 등의 ‘스마트센싱(Smart Sensing)’과 AI컨트롤 알고리즘을 활용해 2016년 동물을 대상으로 수술을 진행했다.

사람의 직접적인 개입이 없이 이뤄진 이 실험에서 STAR는 돼지를 대상으로 한 문합술 등 일부 수술에서 경험이 많은 의사보다 뛰어난 능력을 선보이며 무인 수술로봇 가능성을 보여줬다.[4]

하지만 인공지능이 의사를 대체하여 외과수술도 집도할 수 있느냐의 문제에 대해서는 여전히 불가능하다고 말하는 의견도 있다.

그 이유로 가장 많이 제기 되는 것은 바로 의학은 문제 자체가 다양한 다중시스템이라는 점에서이다. 예를 들어 간암을 진단했다 해도 수술을 포함하여 다양한 치료법과 치료제 처방은 소위 명의라는 분들의 노하우가 공개되어있지 않으므로 당연히 의사가 백전백승일 것이다.

결국 인공지능은 딥러닝이라는 프로세스에 의해 문제를 정확히 정의해야 한다. 거기에 수많은 데이터를 넣어서 공부를 시켜야 명의처럼 똑똑해진다. 그러나 기계학습을 하기 위해서 필요한 데이터를 제공할 수 있는 의사 본인들은 스스로의 노하우를 공개하는 것에 거부감을 가질 수 있을 뿐 아니라 컴퓨터가 이해할 수 있는 데이터로 표기하기에 어려운 전문가적인 직감을 진단·치료에 상당 부분 적용해주어야 하기 때문이다. 무엇보다 진단·치료가 연결되는 다중복합시스템으로 알고리즘을 만들어야 하는데 모든 병원 의료행위는 보험수가와 연결돼 있으므로 다중진단시스템인 인공지능의 갈 길은 멀다고 주장한다. [1]

정리하자면 헬스케어 분야의 인공지능 미래가 밝지 않다고 말하는 것은 아직 의료인 숫자가 모자라는 상황에서 인공지능을 기계학습시킬 수 있는 스승이 부족해서가 아닐까 싶다. 즉 다시 말해 필자의 의견은 도메인 지식을 충분히 제공할 사람이 있다면 충분히 구현될 수 있다는 것이다. 여러 사람들이 제시하는 또 다른 이유인 비인간적이다 라는 점은 감성적 전달 문제인데, 이 경우에도 엘리자와 같이 오히려 대중들에게 호평을 받기도 했으니 충분히 가능성이 열려있는 것이다.

[에세이 본론-2부 ] “현재 진행 중인 과제지만 인공지능/컴퓨터 기술로 다루기 어려운 문제는 무엇인가?(1)”

다음으로 제시되었던 이유였던 ‘컴퓨터가 이해할 수 있는 데이터로 표기하기 어려운 전문가적인 직감을 학습할 수는 없을 것이다’라는 이유에 대해서도 자세히 이야기를 해보려고 한다.

실제로 데이터를 아무리 많이 확보했다 해도 문제가 해결되는 것은 아니다. 네이처에서 발표했던 구글의 검색 데이터를 사용해서 독감을 예측하는 모델이 2년 뒤인 2013년에는 2배 가까운 차이로 빗나가서 아주 망신을 당했다.

굳이 구글의 사례가 아니더라도 수많은 기업들이 데이터 중심을 외치며 빅데이터에 수많은 돈을 투자했다. 하지만 그 중 대부분의 빅데이터 프로젝트는 성공하지 못했다. 왜 그런 걸까? 데이터도 있고, 분석 능력도 갖췄다면 항상 옳은 결정을 내릴 수 있어야 하는 것 아닌가?[5]

인용한 포스팅의 본문에서는 바로 ‘숫자로 표현되지 않는 데이터’ 때문이라고 말한다. 빅데이터는 정적인 시스템에서는 큰 효과를 발휘한다. 구성하는 개체들의 속성이 일관되고 변화가 적기 때문이다. 하지만 동적인 시스템에서는 다르다. 대표적인 동적 시스템이 바로 인간이다. 인간과 인간은 서로 상호작용을 주고 받으며 복잡한 패턴을 만들어내고 끊임없이 변화한다. 수많은 변수에 영향을 받는다. 그래서 인공지능은 어떻게 하면 효율적으로 상품을 배송할 수 있는지는 구할 수 있지만, 주식 시장의 움직임이나, 어떤 드라마가 흥행에 성공할지 그러지 못할지 등과 같이 인간과 관련되어 있는 의사 결정에는 힘을 발휘하지 못한다는 의견이다.

외과 수술을 집행할 인공지능 의사를 구현하는 문제에서도 생각해보자. 외과 수술을 집도하려 하는데, 가지고 있던 이전 환자들의 데이터와 수술해야할 환자의 데이터를 비교해서 제거해야 할 종양의 위치를 계산했다. 그런데 수술을 시작하고 메스를 그 위치에 대려고 하는 순간, 종양이 전혀 다른 위치로 옮겨가버린다. 이런 것이 바로 동적 시스템이다.

이런 문제들을 수량화된 데이터로만 이해하려고 하면 상당히 많은 오류를 야기할 수 있다. 이를 트리시아는 정량화 편향이라고 부른다. 우리는 이런 시스템을 이해할 때 숫자 데이터뿐만 아니라 반드시 숫자로 표현되지 않는 데이터도 봐야 한다. 빅데이터는 아무리 크더라도 결국에는 수량화된 데이터이다. 하지만 실제 현장으로 나가서 사람들을 보고, 그들과 공감하는 것은 숫자로 표현할 수 없는 데이터를 알려준다. 트리시아는 이를 big data가 아닌 thick data 라고 표현했다. thick data는 빅데이터가 보지 못하는 통찰을 준다. 정성적인 데이터는 수량화할 수는 없지만 맥락(context)과 이야기(narrative)를 이해하게 해준다. 이것들이 빅데이터와 합쳐져야 우리는 미래를 제대로 볼 수 있다는 것이다.

[에세이 본론-3부 ] “현재 진행 중인 과제지만 인공지능/컴퓨터 기술로 다루기 어려운 문제는 무엇인가?(2)”

위에서 언급한 이슈를 정리하자면 아주 생소한 데이터가 들어오는 상황에 대처가 어렵다는 말이 될 수도 있으며 또는 정량적으로 표기될 수 있는 데이터만에 치우쳐져 오류를 야기 할 수 있다는 말이라고 해석하였다. 이러한 점은 외과 수술을 집도할 인공지능 의사를 만드는 것에 있어서 해결해야할 넘지 못할 큰 장벽이 될 수 있다.

하지만 필자의 생각은 조금 다르다. 잘 일어나지 않는 상황에 대한 대응이나 정성적인 데이터에 대한 통찰력이 필요하지 않다는 말이 아니다. 분명히 생각지도 못한 드라마틱한 상황들은 일어나고 있으며 정량적으로 표현하지 못하는 데이터는 현실세계에 존재하기 때문에 이들에 대한 학습능력 또한 역시 갖춰져야 인간만이 할 수 있다는 ‘임기응변’ 따위에 문제에 있어서도 인공지능은 인간에 더 가깝게 흉내 낼 수 있을 것이다. 필자가 다르다고 생각한 점은 바로 ‘넘지 못할 장벽’이 아닌 ‘어렵겠지만 넘을 수 있는 문제’라고 생각한 점에서이다.

첫 번째, 생소한 데이터에 대한 해결법에 대한 고찰이다. 이 문제를 해결하는 방법에 대해 논의하기 이전에 먼저 알리고 싶은 것은 바로, 생소한 상황에 대한 대응 능력은 인간마저도 부족한 경우가 있다는 것이다. 인공지능은 휴먼어빌리티를 모방하는 것을 말하기 때문에 보지 못했던 문제에 대해 당황하고 실수를 하는 것들은 논리적으로 생각했을 때 어쩌면 인간을 아주 잘 따라한 것이라 생각하지만 그럼에도 불구하고 그 이상의 능력을 기대해보자면, 더 많이 경험하도록 하는 것이 해결책일 것이다.

최근 생성적 적대 신경망(generated adversarial network, GAN)이라는 딥러닝 기술을 이용하여 훈련에 필요한 영상을 직접 다량 생성하는 작업이 진행되고 있다. 더불어 2019년 1월, 서울아산병원 김남국 교수팀에서는 인공지능의 학습에 필요한 자료영상을 무제한으로 생성할 수 있는 기술을 개발하는 일에 성공했다고 발표했다. 라벨링 과정에서 소모되는 비용과 시간의 문제 역시 기술적으로 해결될 조짐이 보이고 있는 것이다.[6] 그렇다면 무제한으로 생성되는 여러 학습용 데이터들 중에서는 이상치나 결측치 등 outlier 역시 여러 번 관찰되고 학습될 가능성이 있다는 것을 말하므로 실전 테스트 시에도 이에 대한 대응력이 충분히 높아질 것이라는 기대이다.

두 번째, 정량적으로 표현하기 어려운 데이터에 대한 고찰이다. 퍼지이론은 퍼지 집합의 사고 방식을 기초로 주관적이거나 불분명한 정성적 개념이나 언어 등의 애매함 등을 수학적으로 접근하려는 이론이다. 퍼지로직과 신경망을 통합시킨 연구는 이미 진행 중이며, 지속적인 연구의 끝에 어떠한 정성적인 개념들도 정량적으로 표기하여 결국 문제를 해결할 수 있을 것이라고 생각한다.

필자의 생각대로라면 가까운 미래에 AI 서전이 상용화가 될 수 있을 것 같지만 그렇지 못할 것이라는 의견도 분분한 원인으로는 바로 예컨대, 다름이 아닌 윤리적인 문제일 것이다.

[에세이 결론 또는 마무리 ] “현재 직면하고 있는 문제들을 극복할 수 있다면 언제쯤이나 극복할 수 있을 것인가?”

윤리적으로 다뤄보아야 할 문제가 많은 것은 자명하나 AI 의사가 개발이 된다면 대표적인 아주 큰 장점이 하나 있다. 소위 명의들은 몇달을 기다려야 치료를 받을 수 있다. 사람은 일할 수 있는 시간이 정해져 있기 때문이다.

하지만 알파고와 같은 의사가 헬스케어 분야에 있다면 어떨까? 알파고 의사는 24시간 진료도, 수술도 가능하며 수백 수천의 알파고 클론이 가능하다. 알파고에서 볼 수 있듯이 다양하고 복잡한 다중진단시스템을 잘 이해하고 실수 없이 진단하며 다양한 의학 자료를 공부해 치료법을 제안할 수 있는 미래 의사는 결국 인공지능이 아닐까? 이렇게 기술적인 문제가 아닌 윤리적인 문제에 대한 타협이 원만히 이루어졌을 때 상용화가 가능할 것이다.

[참고문헌 및 인터넷 사이트 ] [1] http://www.hitnews.co.kr/news/articleView.html?idxno=13969 [2] https://m.zdnet.co.kr/column_view.asp?artice_id=20160518112014&re=zdk#_enliple [3] https://news.joins.com/article/20632144 [4] http://www.dailymedi.com/detail.php?number=851038 [5] https://brunch.co.kr/@bumgeunsong/37 [6] https://brunch.co.kr/@bnviiteye/20