Centrala begrepp
PathoTune은 다중 모달 프롬프트 튜닝을 통해 일반적인 시각 기반 모델을 병리학 특화 작업에 효과적으로 적응시킬 수 있다.
Sammanfattning
이 논문은 병리학 이미지 분석을 위한 효율적인 모델 적응 방법인 PathoTune을 제안한다. 기존 연구에서는 병리학 전문 모델을 사전 학습하거나 전체 미세 조정하는 방식을 사용했지만, 이는 비효율적이다. PathoTune은 시각 기반 모델이나 병리학 기반 모델을 활용하여 다중 모달 프롬프트 튜닝을 통해 병리학 작업에 효과적으로 적응시킬 수 있다.
PathoTune은 작업 특화 시각 프롬프트, 작업 특화 텍스트 프롬프트, 인스턴스 특화 시각 프롬프트를 사용하여 기반 모델과 병리학 작업 간의 도메인 차이를 해소한다. 실험 결과, PathoTune은 다양한 병리학 데이터셋에서 기존 방법들을 크게 능가하며, 정교하게 사전 학습된 병리학 기반 모델보다도 우수한 성능을 보인다. 이를 통해 효율적인 모델 적응이 병리학 전문 모델 사전 학습보다 더 중요함을 시사한다.
Statistik
병리학 이미지 분류 작업에서 PathoTune은 단일 모달 프롬프트 기반 방법들보다 우수한 성능을 보인다.
PathoTune은 정교하게 사전 학습된 병리학 기반 모델보다도 더 나은 성능을 달성한다.
효율적인 모델 적응이 병리학 전문 모델 사전 학습보다 더 중요한 것으로 나타났다.
Citat
"PathoTune not only surpasses SOTA methods but also remarkably outperforms pretrained pathological foundation models using linear probing, providing a new paradigm for computational pathology applications in the pretrain-finetune era."
"The results demonstrate the superiority of PathoTune's multi-modal prompts elaborated for domain gaps over these approaches using single-modal prompts."