核心概念
MedCodERは、医療記録からの疾患診断の抽出、関連するICD-10コードの検索、そしてそれらの再ランキングを組み合わせることで、正確かつ解釈可能な医療コーディングを実現する。
要約
MedCodERは、医療コーディングの自動化に向けた3つの主要コンポーネントから構成されている:
-
疾患診断、根拠テキスト、初期のICD-10コードの抽出
- 大規模言語モデル(LLM)を使用して、医療記録から疾患診断、根拠となるテキスト、初期のICD-10コードを抽出する。
- 抽出された疾患診断は次のステップの検索に使用され、根拠テキストと初期のICD-10コードは最終的なランキングに使用される。
-
ICD-10コードの検索
- 抽出された疾患診断とICD-10コードの説明文との間の意味的類似性に基づいて、関連するICD-10コードを検索する。
- これにより、膨大なICD-10コードラベルスペースを効果的に絞り込むことができる。
-
コード再ランキング
- 前のステップで検索されたICD-10コードと、LLMによって生成された初期のICD-10コードを組み合わせ、根拠テキストを考慮して再ランキングする。
- これにより、最終的な予測ICD-10コードのリストが生成される。
MedCodERは、疾患抽出、ICD-10コード検索、再ランキングの各コンポーネントを統合することで、従来の手法を大きく上回る精度(マイクロF1スコア0.60)を達成している。また、抽出された疾患診断と根拠テキストを医療記録に対応付けることで、医療コーダーにとって解釈可能で説明可能な出力を提供する。
統計
医療記録中の血圧: 180/120と高値
医療推論: 収縮期および拡張期血圧が高値
医療処置: リシノプリルを1日40mgに増量する
引用
"MedCodERは、疾患抽出、ICD-10コード検索、再ランキングの各コンポーネントを統合することで、従来の手法を大きく上回る精度を達成している。"
"MedCodERは、抽出された疾患診断と根拠テキストを医療記録に対応付けることで、医療コーダーにとって解釈可能で説明可能な出力を提供する。"