Conceptos Básicos
長期入院患者の臨床経過要約を生成する際、関連エンティティの網羅性と忠実性を高めるために、エンティティ選択を明示的に行い、文レベルの計画を導入することが重要である。
Resumen
本論文では、長期入院患者の臨床経過要約の生成に取り組んでいる。
- 入院中の患者の情報は膨大で、関連エンティティを網羅的に把握することが困難である。また、生成された要約が忠実でない可能性がある。
- 著者らは、まず関連エンティティを抽出・分類するための専用のモデルを構築した。次に、LLMに対してこれらのエンティティを活用させる方法として、SPEER (Sentence-level Planning via Embedded Entity Retrieval)を提案した。
- SPEERでは、関連エンティティをソース文書に埋め込み、LLMに対してそれらのエンティティを順番に検索・活用させながら要約を生成させる。
- 実験の結果、SPEERはエンティティの網羅性と忠実性の両面で優れた性能を示した。特に、既存の医療機関のデータを用いた評価でも頑健性が確認された。
Estadísticas
患者1人あたりの平均在院日数は6.3日である。
1つの入院につき平均25.5~162.7の診療記録が存在する。
臨床経過要約の平均長は11.4~37.0文である。
Citas
"Clinician must write a lengthy summary each time a patient is discharged from the hospital. This task is time-consuming due to the sheer number of unique clinical concepts covered in the admission."
"To increase entity coverage, we train a smaller, encoder-only model to predict salient entities, which are treated as content-plans to guide the LLM."
"Sentence-level planning acts as a form of state tracking in that the model is explicitly recording the entities it uses."