Core Concepts
電子カルテデータの多様なモダリティ(時系列データ、診療記録など)を統合的に活用し、術後合併症の発生を正確に予測する手法を提案する。
Abstract
本研究は、電子カルテデータの多様なモダリティを効果的に活用し、術後合併症の発生を予測する手法を提案している。
主な内容は以下の通り:
時系列データの特徴(不規則性、欠損値など)に対応するため、動的な埋め込みとトークン化手法を導入したLongformerモデルを提案した。これにより、時系列データの特性を適切にモデル化できる。
時系列データと診療記録の相互関係を捉えるため、患者の退院サマリーを用いた大域的な対照学習手法を提案した。退院サマリーは患者の入院期間全体を包括的に表しているため、多様なモダリティの特徴を効果的に統合できる。
退院サマリーに時系列データの特徴を補完するため、言語モデルを活用して退院サマリーを改善する手法を提案した。これにより、多様なモダリティ間の整合性が高まり、予測精度が向上した。
提案手法を実際の電子カルテデータに適用し、術後合併症の予測精度が従来手法を大きく上回ることを示した。
本研究は、電子カルテデータの多様なモダリティを統合的に活用し、術後合併症の予測精度を大幅に向上させた点で意義があり、医療分野における機械学習の応用に貢献するものと考えられる。
Stats
本研究で使用したデータセットは、2014年から2019年の間に3つの医療センターで行われた124,777件の主要入院手術の電子カルテデータである。
データには、113,953人の患者の年齢(平均51歳、最小18歳、最大106歳)、性別(男性48%、女性52%)、言語、民族、人種、喫煙状況、郵便番号、Body Mass Indexなどの人口統計学的情報が含まれている。
また、14種類の術中vital signデータ(収縮期血圧、拡張期血圧、平均動脈圧、心拍数、呼吸数、酸素流量、吸入酸素濃度、酸素飽和度、終末呼吸二酸化炭素濃度、最小肺胞濃度、呼吸終末陽圧、最高吸気圧、一回換気量、体温)と173種類の診療記録(入院時病歴、手術記録など)が含まれている。
さらに、9種類の主要術後合併症(ICU入室48時間以上、急性腎障害、人工呼吸器使用の延長、院内死亡、創傷合併症、神経学的合併症、敗血症、心血管合併症、静脈血栓塞栓症)の発生有無が含まれている。