核心概念
医療画像と放射線レポートの関係を学習するためのメモリバンクを初期化し、クロスモーダルの意味的整合性を保ちながら、生成されたレポートの流暢性と正確性を向上させる。
摘要
本研究は、放射線レポートを自動生成するための手法を提案している。
-
メモリバンクの初期化:
- 放射線レポートのトピックを学習し、疾患関連の表現とモダリティ間の共通知識をメモリバンクに格納する。
- これにより、画像と文章の関係をより効果的に学習できる。
-
クロスモーダルの意味的整合性の保持:
- メモリバンクから検索した知識の意味的整合性を保つため、クロスモーダルの意味的整合化モジュール(SAM)を提案する。
- SAMは、異なるモダリティの表現を意味的に整合させ、デコーダへの入力として使用することで、レポート生成を支援する。
-
学習可能なプロンプトの活用:
- デコーダに学習可能なプロンプトを追加し、生成時の状態や追加情報を記憶することで、より流暢なレポートの生成を実現する。
実験の結果、提案手法は既存手法を上回る性能を示し、生成されたレポートの質の高さと解釈可能性が確認された。
统计
放射線レポートの長さは、提案手法を用いることで大幅に改善された。
提案手法は、既存手法と比べて、BLEU-4スコアで0.012、METEORスコアで0.011、ROUGE-Lスコアで0.007の向上が見られた。
引用
"メモリバンクは、疾患関連の表現とモダリティ間の共通知識を学習する重要な役割を果たす。"
"クロスモーダルの意味的整合化モジュール(SAM)は、異なるモダリティの表現を意味的に整合させ、デコーダへの入力として使用することで、レポート生成を支援する。"
"学習可能なプロンプトを追加することで、生成時の状態や追加情報を記憶し、より流暢なレポートの生成を実現できる。"