本研究では、スペイン語の医療記録を対象に、言語モデルとオントロジーを組み合わせた手法を提案している。具体的には以下の通り:
医療記録のデータセットを作成し、個人情報を匿名化した。データセットには8,881件の記録と173種類の皮膚病が含まれている。
医療用オントロジー(UMLS、SNOMED、ICD-10、MedDRA)を活用し、皮膚病の種類、部位、重症度といった特徴を抽出した。
抽出した特徴を段階的に予測するモデルを構築した。まず皮膚病の種類を予測し、次に部位、最後に重症度を予測するというように、順序を変えて性能を比較した。
実験の結果、皮膚病の種類、部位、重症度の順に特徴を予測するモデルが最も良い性能を示した。精度は0.84、マイクロF1スコアは0.82、マクロF1スコアは0.75となった。
誤分類の分析から、外見が似た皮膚病の区別が難しいことが分かった。また、重症度の予測が課題であることも明らかになった。
本手法は、医療記録の自動分析に有効であり、医療従事者の業務を支援できると考えられる。今後は、さらなる性能向上や、他の医療分野への応用が期待される。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania