Core Concepts
MOWAは、従来の個別のタスク特化型モデルとは異なり、複数の代表的な画像ワーピングタスクを単一のモデルで学習・実行できる新しい手法を提案する。
Abstract
本研究では、ステッチ画像、広角画像の矯正、シャッター歪み画像の補正、回転画像の矯正、魚眼画像の補正、ポートレート画像の歪み補正の6つの代表的な画像ワーピングタスクを対象とする。従来のタスク特化型モデルとは異なり、MOWAは以下の特徴を持つ:
領域レベルと画素レベルの2段階の運動推定を行うことで、複雑な運動構造を効果的にモデル化する。
軽量な点ベースの分類器を導入し、入力画像のタスクタイプを推定することで、特定のタスクに適応した画像ワーピングを実現する。
プロンプト学習モジュールを用いて、推定されたタスクタイプ情報を特徴マップの変調に活用し、タスク適応性を高める。
実験の結果、MOWAは個別のタスク特化型モデルと比べて、ほとんどのタスクにおいて優れた性能を示すことが確認された。さらに、MOWAは未知のシーンや新規タスクにも適応可能な汎化性を備えていることが示された。
Stats
画像ワーピングの品質指標PSNR、SSIMの値が高いほど良好な結果を示す
ポートレート画像の補正では、顔の形状の類似度を表すShapeAccの値が高いほど良好な結果を示す