Główne pojęcia
医療記録(EHR)のデータを研究活動に活用するために、疾病名と人口統計データを標準化する。
Streszczenie
本研究では、医療記録(EHR)のデータを研究活動に活用するためのシステムモデルを提案している。
データ前処理:
年齢、性別、診断日のデータを標準化する。
欠損値を除去する。
疾病名の注釈付け:
機械学習のNER(Named Entity Recognition)モデルを使用して、診断テキストから疾病名を抽出する。
抽出した疾病名の精度をMetaMapと比較評価する。
疾病名の標準化:
抽出した疾病名をICD-10コードに変換する。
ICD-10 APIを使用して、疾病名とICD-10コードを関連付ける。
可視化:
標準化された疾病データと人口統計データを対話型のダッシュボードで表示する。
研究者が疾病の傾向や特徴を分析できるようにする。
本システムにより、医療記録のデータを研究活動に活用できるようになり、疾病の原因や発生率の分析が可能になる。
Statystyki
年齢が60歳以上の患者の割合は全体の25%である。
女性患者の割合は全体の60%である。
過去5年間の診断件数は年平均2,500件である。
Cytaty
"医療記録(EHR)は、医療研究における重要なデータソースである。"
"ICD-10は、疾病データの標準化に有効な分類システムである。"
"自動ICD-10コーディングは、医師の作業負担を軽減できる。"