教師なしの手法を用いて、教師あり手法と同等以上の説明可能性を持つ医療記録の自動コーディングを実現する。
本研究では、知識グラフ(KG)と大規模言語モデル(LM)を組み合わせた新しい質問応答システムを提案し、その有効性を示した。このシステムは、自然言語の質問に対して正確で理解しやすい回答を生成することができる。
長期入院患者の臨床経過要約を生成する際、関連エンティティの網羅性と忠実性を高めるために、エンティティ選択を明示的に行い、文レベルの計画を導入することが重要である。
ChatGPT 3.5を使用して、薬剤処方文書の名称抽出と文章展開を行い、その性能を評価した。
DeepScribeは、医療文書の品質と正確性を評価するための包括的な手法を提示している。様々な指標を組み合わせたDeepScoreを用いて、医療文書の品質を継続的に改善していく。
医療会話の自動文字起こりと話者識別を統合したシステムを開発し、医療従事者の文書作成負担を大幅に軽減する。
MedCodERは、医療記録からの疾患診断の抽出、関連するICD-10コードの検索、そしてそれらの再ランキングを組み合わせることで、正確かつ解釈可能な医療コーディングを実現する。
MedPromptExtractは、医療記録の自動匿名化と高精度なデータ抽出を実現するツールである。半教師あり学習、大規模言語モデル、自然言語処理、プロンプトエンジニアリングを組み合わせて、非構造化の医療記録を分析可能な構造化データに変換する。
医療記録の質問応答システムの信頼性を高めるには、回答不能な質問を適切に識別することが重要である。しかし、現在の医療記録の質問応答データセットには、回答不能な質問に特有のパターンが存在し、単純なフィルタリングで識別できてしまう問題がある。本研究では、このデータバイアスを軽減するための新しい検証・テストデータの分割方法を提案し、その有効性を示す。
確率的しきい値フィルタリングと誤り処理を用いて、医療記録の自然言語質問から SQL クエリの生成精度を向上させる。