핵심 개념
低線量CT画像の雑音除去と画質向上を目的として、CNNとTransformerを統合したU字型ネットワークアーキテクチャ「WiTUnet」を提案する。ネストされた密結合スキップパスウェイを導入し、エンコーダとデコーダ間の特徴マップの整合性を高めることで、効果的な特徴統合を実現する。さらに、計算コストを抑えつつ大域的情報を捉えるウィンドウ型Transformerと、局所的な特徴を強化するLiPeモジュールを組み合わせることで、高精度な画像再構築を実現する。
초록
本論文は、低線量CT(LDCT)画像の雑音除去と画質向上を目的とした新しいネットワークアーキテクチャ「WiTUnet」を提案している。
WiTUnetの主な特徴は以下の通りである:
-
ネストされた密結合スキップパスウェイ: エンコーダとデコーダ間の特徴マップの整合性を高め、効果的な特徴統合を実現する。
-
ウィンドウ型Transformer: 大域的な情報を捉えつつ、計算コストを抑えるウィンドウ型の自己注意機構を導入する。
-
LiPeモジュール: CNNベースのブロックを用いて、局所的な特徴の捕捉を強化する。
これらの特徴により、WiTUnetは従来のCNNやTransformerベースの手法と比較して、PSNR、SSIM、RMSEの各指標で優れた性能を示している。特に、大域的な情報と局所的な特徴を効果的に融合することで、高精度な画像再構築を実現している。
통계
LDCT画像と比較して、WiTUnetは平均PSNR値が33.2851dBと最も高い。
WiTUnetのSSIM値は0.9187と最も高く、画像の構造的類似性が最も良好。
WiTUnetのRMSE値は8.8434と最も低く、元の画像との誤差が最も小さい。
인용구
"WiTUnetは、CNNとTransformerを統合したU字型ネットワークアーキテクチャであり、特徴マップの整合性を高めるネストされた密結合スキップパスウェイ、大域的情報を捉えるウィンドウ型Transformer、局所的特徴を強化するLiPeモジュールを特徴としている。"
"WiTUnetは、PSNR、SSIM、RMSEの各指標で従来手法を上回る優れた性能を示しており、大域的情報と局所的特徴の効果的な融合により高精度な画像再構築を実現している。"