本研究は、医療用放射線画像の表現学習のための革新的なアプローチを提案する。従来の手法は「所見」と「印象」の階層的関係を無視していたが、本研究ではこの関係に着目し、グローバルな視覚表現を「印象」と、トークンレベルの視覚表現を「所見」とそれぞれ整合化する新しい枠組みHybridMEDを提案する。さらに、「印象」の生成を補助する要約ブランチと、画像から「印象」を生成するキャプショニングブランチを並列に構築し、知識蒸留を用いて効率的に学習を行う。
X線画像を用いた医療レポート生成は、医療診断の負担を大幅に軽減し、患者の待ち時間を短縮することができる重要な研究分野である。本研究では、CheXpert Plusデータセットを用いて、既存の主要なX線レポート生成モデルとLLMを包括的に評価するベンチマークを実施し、さらに、自己教師あり自己回帰生成と画像テキスト対比学習を含む多段階事前学習戦略を用いた新しい大規模モデルMambaXray-VLを提案した。
分形次元は、脳動脈瘤破裂リスクを予測する上で最も重要な特徴である。
定量的超音波は、アルベオラー粘膜と歯肉の2つの歯周軟組織を区別できる可能性がある。
本研究では、3D エコー画像と物理情報ニューラルネットワーク (PINN) を組み合わせた ADEPT と呼ばれる新しい手法を提案し、心臓弁組織の弾性特性を非侵襲的に推定することができる。
マイクロ波医療画像診断のコンフォーカルアルゴリズムでは、目標点から検出器までの伝播時間の正確な評価が重要である。時間遅延の不正確さは、画像コントラストの劣化につながる。
ステレオ腹腔鏡を用いたスペックル照明空間周波数領域イメージングにより、複雑な表面形状を持つ組織の吸収係数と散乱係数を正確に推定することができる。
本手法は、3D胸部CT画像から異常所見を予測し、それぞれの異常所見に対して特定の説明文を生成することで、より完全なレポートを生成する。
SCKansformerモデルは、Kansformerエンコーダ、SCConvエンコーダ、およびグローバル-ローカル注意エンコーダを統合することで、骨髄血細胞の高精細分類を実現する。これにより、従来の方法よりも高い分類精度と効率を達成する。
BRAU-Net++は、CNN と Transformer の長所を統合した U 字型ハイブリッドアーキテクチャであり、動的スパース注意メカニズムを活用することで、効率的に長距離依存関係をモデル化し、高精度な医療画像セグメンテーションを実現する。