本論文は、医療用基盤モデルの課題に取り組むための新しい視点「知識分解」を提案している。医療用基盤モデルは一般的な特徴抽出能力に優れているが、特定の医療タスクに対する性能が専門家モデルに劣る傾向がある。また、基盤モデルは膨大なパラメータ数と計算コストを要するため、実用的な展開が困難である。
本研究では、知識分解の手法「LoRKD」を提案する。LoRKDは基盤モデルを複数の軽量な専門家モデルに分解する。各専門家モデルは特定の解剖学的領域に特化しており、共通の基盤モデルと低ランクの専門家モジュールから構成される。低ランクの専門家モジュールにより、異なる領域のデータ間の勾配競合を解消し、特化性能を向上させる。また、効率的な知識分離畳み込みにより、単一の順伝播で勾配分離を実現し、計算効率を大幅に改善する。
実験の結果、LoRKDは基盤モデルと比べて、パラメータ数と計算コストを大幅に削減しつつ、特定領域のタスクでより高い性能を達成できることが示された。さらに、LoRKDの分解モデルは基盤モデルを上回る転移性能も示した。これらの結果は、知識分解アプローチが医療分野における基盤モデルの実用化に貢献できることを示唆している。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Haolin Li, Y... pada arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19540.pdfPertanyaan yang Lebih Dalam