Core Concepts
본 연구는 정책 증류와 행동 주조 기법을 활용하여 와파린 유지 용량 처방을 위한 설명 가능한 심층 강화 학습 모델을 제안한다.
Abstract
본 연구는 와파린 유지 용량 처방을 위한 설명 가능한 심층 강화 학습 모델을 제안한다. 와파린은 좁은 치료 범위와 다양한 환자 반응으로 인해 정밀 의료의 좋은 대상이다. 기존 와파린 용량 처방 프로토콜은 주로 임상시험 데이터와 지도 학습 방법을 사용하여 개발되었지만, 이는 블랙박스 모델이어서 처방 근거를 설명하기 어렵다.
본 연구에서는 근접 정책 최적화(PPO) 기법을 사용하여 심층 신경망 모델을 훈련하였다. 모델의 설명 가능성을 높이기 위해 행동 주조 기법을 도입하였다. 행동 주조 기법에는 행동 정규화와 행동 초점화가 포함된다. 이를 통해 모델이 용량 변경 횟수를 줄이고 0% 용량 변경을 선호하도록 유도하였다.
최종 모델은 의사 결정 트리로 증류되어 실무자에게 친숙한 용량 처방표 형태로 제공된다. 실험 결과, 제안 모델은 기존 프로토콜보다 우수한 성능을 보이면서도 설명 가능성이 높다.
Stats
환자의 나이, 체중, 키, 성별, 인종, 흡연 여부, 병용약물 정보는 평균 67.3세, 199.24파운드, 66.78인치, 여성 53.14%, 백인 95.18%, 비흡연 90.33%, 아미오다론 투여 11.54%, 플루바스타틴 투여 0.03%로 나타났다.
환자의 CYP2C9 유전형은 *1/*1 67.39%, *1/*2 14.86%, *1/*3 9.25%, *2/*2 6.51%, *2/*3 1.97%, *3/*3 0.00%로 분포되었다.
환자의 VKORC1 유전형은 G/G 38.37%, G/A 44.18%, A/A 17.45%로 나타났다.
Quotes
"와파린 용량 처방 프로토콜은 주로 임상시험 데이터와 지도 학습 방법을 사용하여 개발되었지만, 이는 블랙박스 모델이어서 처방 근거를 설명하기 어렵다."
"본 연구에서는 근접 정책 최적화(PPO) 기법을 사용하여 심층 신경망 모델을 훈련하였다. 모델의 설명 가능성을 높이기 위해 행동 주조 기법을 도입하였다."
"최종 모델은 의사 결정 트리로 증류되어 실무자에게 친숙한 용량 처방표 형태로 제공된다."