Core Concepts
U-Net v2は、低レベル特徴量に意味的情報を注入し、高レベル特徴量に細部情報を精緻化することで、医療画像セグメンテーションの精度を向上させる。
Abstract
本論文では、医療画像セグメンテーションのための新しいU-Net v2フレームワークを提案する。
まず、深層ニューラルネットワークエンコーダを使って入力画像から多階層特徴量を抽出する。次に、SDIモジュールにおいて、各階層の特徴量に対して以下の処理を行う:
空間注意機構と channel注意機構を適用し、局所的な空間情報と大域的なチャンネル情報を統合する。
各階層の特徴量を同一解像度に調整する。
調整された特徴量に対してHadamard積を適用し、高階層の意味的情報と低階層の詳細情報を融合する。
最後に、精緻化された特徴量をデコーダに送り、セグメンテーションを行う。
提案手法は、スキンレジョンセグメンテーションとポリープセグメンテーションの公開データセットで評価され、既存手法を上回る精度を示した。また、計算コストと GPU メモリ使用量も効率的であることが確認された。
Stats
本研究は、NIH NIBIB Grant R01-EB004640の支援を受けて行われた。