Core Concepts
本論文では、二段階のインスタンスセグメンテーションモデルにおける重要な問題点を解決するための新しいアーキテクチャSelf-Balanced R-CNN (SBR-CNN)を提案する。具体的には、IoU分布の不均衡、特徴レベルの不均衡、パラメータ数の増加といった課題に取り組む。
Abstract
本論文では、二段階のインスタンスセグメンテーションモデルにおける重要な問題点を解決するための新しいアーキテクチャSelf-Balanced R-CNN (SBR-CNN)を提案している。
まず、IoU分布の不均衡問題に対処するため、Recursively Refined R-CNN (R3-CNN)と呼ばれる新しいアーキテクチャを提案した。R3-CNNは、検出ヘッドとマスクヘッドに内部ループを導入することで、IoUの異なる提案領域を段階的に学習する。
次に、特徴レベルの不均衡問題に対処するため、Fully Connected Channels (FCC)と呼ばれる新しい手法を提案した。FCCは、全結合層をより軽量な畳み込み層に置き換えることで、パラメータ数を大幅に削減しつつ、性能を維持することができる。
さらに、Generic RoI Extraction (GRoIE)と呼ばれる新しい特徴抽出層を提案した。GRoIEは、Feature Pyramid Networkの各層からの特徴を適切に融合することで、特徴レベルの不均衡を解消する。
これらの新しい手法を組み合わせたSBR-CNNモデルは、既存の最先端モデルと比較しても同等以上の性能を示す。特に、軽量なResNet-50をバックボーンとして使用した場合でも、12エポックの学習で物体検出とインスタンスセグメンテーションのAPがそれぞれ45.3%と41.5%に達した。
Stats
物体検出のAPが45.3%に達した。
インスタンスセグメンテーションのAPが41.5%に達した。