Core Concepts
LadleNetは、セマンティックセグメンテーションを活用して、赤外線画像から可視画像への高品質な変換を実現する。
Abstract
本論文では、赤外線(TIR)画像から可視(VI)画像への高品質な変換を実現するLadleNetアーキテクチャを提案している。
LadleNetは2段階のU-Netで構成され、Handle moduleとBowl moduleから成る。
Handle moduleは抽象的なセマンティックスペースを構築し、Bowl moduleはそのセマンティックスペースを使ってVI画像を生成する。
Handle moduleの構造を、事前学習済みのDeepLabV3+に置き換えたLadleNet+を提案し、さらなる性能向上を実現した。
KAIST datasetを用いた実験の結果、LadleNetとLadleNet+は既存手法と比べて、SSIM指標で12.4%と15.2%、MS-SSIM指標で37.9%と50.6%の平均改善を達成した。
生成画像の質的評価においても、LadleNet+が最高水準の性能を示した。
Stats
TIR画像とVI画像の平均SSIM値の差は0.1982
TIR画像とVI画像のMS-SSIM値の差は0.5563
TIR画像とVI画像のL1ロスの差は0.0302
TIR画像とVI画像のPSNR値の差は6.0982
Quotes
"LadleNetは、セマンティックセグメンテーションを活用して、赤外線画像から可視画像への高品質な変換を実現する。"
"LadleNet+は、事前学習済みのDeepLabV3+を用いることで、さらなる性能向上を達成した。"