경락경혈학회, 제2차 온라인 학술 아카데미 - 빅데이터와 인공지능, 그리고 진화하는 한의학

빅데이터와 인공지능, 그리고 진화하는 한의학


‘시스템생물학 통한 변증의 과학적 접근’, ‘chatGPT가 한의학 이해할 수 있을까’ 발표

박히준 회장 “연구자들의 성과가 적극 공유되고, 임상 한의사들과 동반 성장하길 바라”

경락경혈학회, 제2차 온라인 학술 아카데미



[한의신문=강현구 기자] 경락경혈학회 (회장 박히준)는 지난달 29일 ‘빅데이터와 인공지능, 그리고 진화하는 한의학’이라는 주제로 온라인 (ZOOM)을 통해 기초연구자와 임상 한의사가 함께하는 제2차 온라인 학술 아카데미를 개최했다.


박히준 회장은 “최근 chatGPT 등 신기술에 한의 의료 가치의 접목이 고려되는 가운데 ‘기초연구를 알면 10년 뒤 한의학의 미래를 예측할 수 있다’라는 모토로 이번 학술대회를 준비했다”라며 “이를 통해 연구자들의 연구 성과가 적극 공유되고, 임상 한의사들과 동반 성장하는 계기가 되길 바라며, 특화된 분야의 정보를 시공간적인 벽을 넘어 함께 교류되는 ‘통섭의 장’이 되길 바란다”라고 전했다.


이봉효 대구한의대학교 교수의 사회로 진행된 이번 학술 아카데미에서는 △시스템생물학을 통한 변증의 과학적 접근 방안 (이상훈 한국한의학연구원 박사) △ChatGPT가 한의학을 이해할 수 있을까? (김창업 가천대학교 교수)라는 주제 발표를 통해 한의학과 인공지능이 만나는 지점에 대한 연구 내용이 공유됐다.


◆ 빅데이터·AI···한의학-시스템생물학의 연결 도구


경락경혈 2차아카데미 1.png


이상훈 박사는 변증(辨證)을 ‘질병의 기저에 있는 생물학적 메커니즘 군집의 패턴을 찾아내는 행위’로 재정의하고, ‘기허(氣虛)’를 예시로 실제 한의 변증을 어떻게 생물학적 메커니즘의 관점에서 해석할 수 있는지에 대한 접근법을 공유했다.


이 박사는 기허(氣虛)라는 한의학적 개념을 생물정보학 (Bioinformatics)도구를 사용해 이해를 돕고자 △기허를 치료하는 한약재가 공유하는 타깃 메커니즘 △기허의 대표 증상이 공유하는 타깃 메커니즘이라는 두 가지 접근법을 적용했다.


이 박사는 기허를 치료하는 한약재가 공유하는 타깃 메커니즘 연구를 위해 보기약재(保氣藥材) 간 공통으로 발견되는 성분이면서 다른 한약재에서는 발견 빈도가 낮은 성분을 ‘코어컴파운드 (핵심 성분)’로 정의하고, 코어컴파운드가 타깃팅하는 생물학적 기전 (약물 작용 경로)을 찾았다.


이어 ‘DAVID (Database for Annotation, Visualization and Integrated Discovery)’라는 생물학적 타깃 예측 도구를 통해 분석해 보기약재들이 가지고 있는 공통의 타깃에서 아미노산 합성, 단백질 및 탄수화물 소화, 미네랄 흡수 등의 데이터를 추출했다.


이를 다시 카테고리화하자 결국 에너지 대사와 관련된 생물학적 기전이 가장 중요한 기허 한약재의 타깃이 됐다는 것을 설명했다.


이 박사는 “기허를 다스리는 한약재들의 고유한 치료 타깃이 에너지 대사라는 것을 볼 때 선조들이 에너지 대사의 장애를 기허라고 정의했을 것으로 추측해 볼 수 있다”라며 “만약 기허를 에너지 대사의 장애라는 생물학적 메커니즘으로 재정의한다면 우리는 에너지의 대사 상태를 진단하는 도구를 만들어 기허의 현대적 진단기기로 활용할 수 있을 것”이라고 밝혔다.


이 박사는 또한 기허의 대표 증상이 공유하는 타깃 메커니즘 연구에서는 WHO 표준 용어집과 연구 논문 등에서 기허의 증상 (피로, 다한, 어지러움 등)을 뽑고, 이를 UMLS (질병 분류 및 유전자 기능 정보)의 CUI (개념 고유 식별자)를 활용, 코드화해 기허의 여러 Symptom (증상)이 공유하는 Gene (유전자)와 이와 관련 공통의 생물학적 기전을 추출해 ‘기허’라고 불리는 다양한 증상이 동시다발적으로 발현되기 위한 공통의 타깃 메커니즘을 도출했다.


이 박사는 이를 통해 미토콘드리아의 전자 전달계와 관련된 경로의 손상이나 아미노산, 탄수화물 대사 경로 등의 손상이 기허의 증상들을 동시에 유발할 수 있는 공통의 생물학적 경로임을 제시했다.


이 박사는 “현재 생물 정보와 데이터베이스는 아직 미완성이고 계속해서 만들어지고 있는 단계로, 한의학의 증상들을 모두 해석할 수는 없다”라며 “다만 이런 식으로 데이터에 접근하는 방법을 찾아가다 보면 우리가 한의학에서 막연하게 기허라고 변증하는 것보다는 생물학적 패스웨이 (작용 경로)가 망가졌을 때 이런 증상들이 동시에 나올 수 있을 것으로 유추해 볼 수 있으며, 더 나아가 이러한 방법을 통해 ‘한의학의 고전적 개념’을 ‘현대 생물학적 개념’으로 재정의할 수 있다”라고 강조했다.


이 박사는 또 “생물정보학의 빠른 발달은 기존에 불가능하다고 여겼던 매우 복잡한 인체 내의 생물학적 현상을 빅데이터와 AI의 도움을 통해 이해할 수 있게 해주고 있어, 향후 생물정보학의 도구를 활용해 한의학의 모호한 임상적 정의들을 현대적인 언어로 재정의할 수 있는 방법론을 공유해나갈 수 있기를 기대한다”라고 덧붙였다.


◆ 한의학의 미래 혁신은 고유 지식 체계와 AI의 통합


경락경혈 2차아카데미 2.png


김창업 교수는 chatGPT를 통해 거대 언어 모델 (LLMs)에게 한의학을 가르치는 방법에 관해 연구한 내용을 공유했다.


김창업 교수에 따르면 chatGPT (openAI 개발)는 생성형 거대 언어 모델 (generative large language models)로서, GPT (generative pre-trained transformer)를 대화형으로 훈련한 모델이다.


GPT는 특정한 작업을 수행하기보다 입력 문장의 다음 단어를 예측함으로써 문장을 생성하는 사전학습모델로, 인간의 표식 (labeling)이 필요 없는 자기 지도 학습 (self-supervised learning)을 이용하기 때문에 기존 인공지능 개발의 병목이었던 대량의 학습 데이터 확보가 용이하다. 현재 서비스되고 있는 chatGPT는 두 가지 종류로 각각 GPT-3.5와 GPT-4에 기반해 있다.


이 chatGPT는 우수한 성능을 바탕으로 변호사 시험, 생물 올림피아드 등 각종 시험에서 인간을 능가하는 퍼포먼스를 보여줘 큰 주목을 받고 있으며, 다양한 종류의 미국 의사 시험에서 이미 높은 성적을 기록해 의료 인공지능 개발에 활용할 수 있을 것인지에 대한 논의가 활발히 이뤄지고 있다.


앞서 김창업 교수 연구팀은 이러한 모델을 한의학 인공지능 개발에도 적용할 수 있을지를 평가하기 위해 테스트한 결과, GPT-4가 2022년 시행된 한의사 국가시험에서 평균 57.29%의 정답률을 기록했다고 공개한 바 있다.


김 교수는 빠르게 발전하고 있는 거대 언어 모델 (large language models, LLMs)의 동향을 이해하기 위해 필요한 기초개념으로서, 오픈소스 기반의 모델과 폐쇄형 소스 기반의 모델, 모델의 크기와 학습 데이터의 크기, 자기 지도 학습 (self-supervised learning)과 전이 학습 및 미세 조정 (fine tuning), 인컨텍스트 학습 (in-context learning) 등을 소개했다.


김 교수는 거대 언어 모델에게 한의학을 가르치는 방법으로 △Pre-training을 통한 사전 학습 모델 (기본 모델)부터 한의학 데이터 활용법 △메타 (Meta)의 LLaMA나 Stanford Alpaca 등 오픈소스로 공개된 기본 모델 및 대화형 모델에 한의학 지식을 미세조정 (fine tuning)하는 방법 △서비스되는 모델의 API 활용에 있어 언어 모델에게 별도로 한의학 DB 문서 입력 및 추론 과정을 고도화시키는 ‘Rerieval/·Gluing-based’ 방법에 대해 소개하며, 각 장단점과 효과적인 전략에 대해 구체적인 방안을 제시했다. 


김 교수는 GPT-4가 작성한 요점을 인용해 “우리는 시작점에 불과하지만 한 가지 확실한 것은 이 지식과 기술의 결합은 우리의 치료법, 환자에 대한 이해, 그리고 한의학의 미래를 혁신적으로 바꿀 것이라는 사실”이라며 “한의학이란 고유의 지식 체계가 인공지능과 어떻게 통합될 수 있을지에 대한 우리 모두의 열정과 호기심, 끊임없는 탐구 정신을 가져야 한다”라고 제언했다.


출처: 한의신문 https://www.akomnews.com/bbs/board.php?bo_table=news&wr_id=53538&page=2