의료 데이터 사이언스의 발전, 닥터 AI

#의료데이터 #닥터AI #데이터사이언스

내 건강을 책임지는 의료 데이터 사이언스, 닥터 AI

의료 데이터
데이터 사이언스 분야의 발전이 눈부신 시대입니다. 이렇게 발전되는 데이터 사이언스 기술이 이제 의료와 헬스케어 분야에 활용되며 건강을 책임지는 것은 물론 사람을 살리는 일까지 하고 있는데요. 데이터 사이언스가 어떻게 의료 분야에서 도움이 되고 있는지 함께 알아보시죠!

의사의 또 다른 진료도구, AI

의료 데이터
‘의료 분야에 어떻게 데이터 사이언스가 적용되지?’ 의문을 품으시는 분들도 계실 거예요. 간단하게 설명하자면 의료계 또한 데이터로 가득하기 때문에 머신러닝, 딥러닝 등의 AI 기술 적용이 가능한 것입니다. 예를 들면 방사선에서 찍는 X-레이의 경우, 그것은 그 자체로 한 장의 이미지 데이터가 되는 것이죠. 이 이미지 데이터를 어떻게 활용할 수 있을까요?

흉부 X-레이 하루 평균 스캔량이 548,000건이 넘는다고 합니다. X-레이 스캔을 보고 진단을 해야 하는 전문의에게 이런 대규모 스캔 물량은 부담을 가중시키고 업무 효율에 악영향을 미치게 되죠. 이런 업무에 머신러닝과 딥러닝 기법의 DNN, CNN 방식을 도입하면 보다 빠르고 정확한 처리가 가능하다고 합니다. 또한 많은 업무량과 빠르게 진행되어야 하는 의사결정 과정 때문에 전문의의 스트레스가 굉장하고 이로 인한 진단 오류 발생률이 30%나 된다고 하는데요. 이런 상황에서 AI를 의료 도구로써 적절히 활용한다면 업무 효율성은 늘고 오류 발생률은 줄일 수 있을 것입니다.

AI가 직접 내리는 정확한 진단

의료 데이터
전문의의 과중한 업무를 도와주는 것 외에 AI를 활용해 직접적으로 환자를 진단하는 경우 도 있습니다. 국내 기업 ‘루닛’은 카이스트 출신 딥러닝 전문가 6인이 설립한 기업으로 AI를 활용해 높은 정확도로 암을 진단하는 기술을 개발했다고 합니다. 그 정확도는 무려 97%라고 하는데요. AI가 스스로 학습하게끔 독자적 훈련 방식을 사용하는 것이 바로 그 비결이라고 합니다.
또한 이 외에도 암 조직을 AI로 분석해 암 치료의 예후를 예측할 수 있다고 합니다. 조직 미세환경 분석을 통해 위험도에 따른 환자 분류를 진행하는데 이렇게 분류한 고위험 환자들은 항암치료 반응률이 높게 나타난다고 하네요. 이와 같은 기술이 계속해서 발전한다면 암과의 사투에서 승리할 날이 멀지 않아 보입니다.

신약개발 분야의 필수 도구 AI

특히 신약개발 분야에서 AI는 딥러닝 기술을 활용해 치료제 발견을 가속화하는데 큰 역할을 하고 있습니다. 전통적인 신약개발은 평균 약 15년이 소요되며, 약 1만여개 중 1개만이 최종 신약개발에 성공하는데 이는 신약 탐색에 수많은 문헌과 보고서, 논문, 생물학 정보 빅데이터에 대한 분석이 필요하고 이 데이터의 양이 사람이 다룰 수 있는 수준을 넘어선 규모이기 때문이라고 합니다.
하지만 신약개발 관련 빅데이터를 구축해 이를 AI에 활용하면서 빠른 신약개발 방법을 제안할 수 있게 되어 신약개발 기간을 획기적으로 단축하고 있다고 합니다. 또한 AI는 신약개발 단계에서 시행착오와 개발비를 줄이는 것은 물론 시판 후의 사후추적에 이르기까지 다양하게 활용된다고 합니다.
코로나 바이러스로 인해 전세계가 고통받는 지금, AI 딥러닝 기술이 굉장히 중요한 역할을 한다고 할 수 있겠습니다.

무엇보다 중요한 것은 데이터

하지만 의료계에서 AI를 활용할 때에는 굉장한 주의가 필요합니다. 데이터를 어떻게 표준화하고 정제하는지가 결과에 엄청난 영향을 끼치기 때문이죠.
GIGO. Garbage in garbage out이라는 말로 정제되지 않은 데이터를 AI에 그대로 넣으면 좋지 않은 결과가 나온다는 말입니다. 목적에 맞는 데이터를 AI에 학습시켜야 원하는 결과를 얻을 수 있다는 것이죠.
데이터 정제의 중요성을 일깨우는 대표적인 예로 ‘이루다’ 서비스를 들 수 있습니다. 이루다를 개발한 스캐터랩은 연애의 과학이라는 어플을 통해 카톡 대화 약 100억 건을 수집했고 이 중 1억 건을 이루다 개발에 활용했다고 하는데요. 이루다의 딥러닝 모델은 대화에 맞춰 ‘스스로 답변을 생성하기’보다는 ‘수많은 답변 데이터 중 선택’하는 방식에 가까웠다고 합니다. 이렇게 학습한 데이터를 바탕으로 이루다의 혐오, 차별발언 문제가 붉어졌고 결국 출시 3주만에 서비스를 종료하게 되었는데 이는 정제되지 않은 데이터를 학습한 결과라고 할 수 있습니다. 이와 비슷하게 카이스트 연구에서도 정상적인 뇌만 학습한 AI가 질병모델을 제대로 구분하지 못한 사례도 있었다고 합니다.

결국 어떤 목적을 위해서 어떤 데이터를 AI에 학습시킬 것인지가 중요하며 이를 위해선 데이터에 대한 이해가 우선되어야 하는데, 특히나 전문 지식이 중요한 의료 분야에서 의료 데이터에 대한 이해가 없다면 유의미한 성과를 내기 어렵다는 점을 시사하는 사례입니다. 사람의 건강과 생명이 걸린 의료 분야이기 때문에 AI 활용에 앞서 무엇보다 신경 써야 할 부분입니다.

데이터 사이언스와 인류의 꿈

한국보건산업진흥원에 따르면, 오는 2025년까지 총 945억 원을 투입해 중환자 의료 데이터셋과 의료 AI 개발을 진행한다고 합니다. 이렇게 지속적인 지원과 개발로 의료계에서의 데이터 사이언스는 계속해서 큰 발전을 이룰 것으로 예상되는데요.
데이터 사이언스의 발전이 단순 진단을 넘어서 질병의 정복과 생명 연장이라는 인류의 꿈에 얼마나 큰 도움이 될지, 기대가 되는 부분입니다.
이제는 사람의 건강까지 책임지는 데이터 사이언스, 제대로 입문하고 싶다면?