本論文は、物理的に実現可能な意味論的セグメンテーション(PhyFea)を提案している。従来の意味論的セグメンテーションモデルは、データ駆動型の最適化を行うため、入力画像のドメインがトレーニング時と異なると、物理的に不可能な予測をすることがある。例えば、空の上に道路が存在するような予測をする。
PhyFeaは、トレーニングデータセットから物理的な制約を抽出し、それを微分可能な損失関数として導入することで、物理的に実現可能な予測を行う。具体的には、以下の2つの物理的制約を考慮する:
PhyFeaは、これらの制約を満たすように、開口演算と選択的膨張を適用することで、物理的に実現可能な予測を行う。
PhyFeaは、ADE20K、Cityscapes、ACDCの3つのベンチマークデータセットで、ベースラインモデルに対して有意な性能向上を示した。特に、SegFormer-B4とOCRNetに適用した場合、Cityscapesで1.5%、ACDCで2.1%のmIoU改善を達成した。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問