Główne pojęcia
Transformer ベースのセマンティックセグメンテーションにおけるデコーダの設計は、主成分分析(PCA)や符号化レートの概念と密接に関係しており、これらの圧縮原理に基づいて、より解釈可能で高性能なデコーダを設計できる。
Streszczenie
Transformer ベースのセマンティックセグメンテーションにおけるデコーダの再考:圧縮こそが重要である
本論文は、Transformer ベースのセマンティックセグメンテーションにおけるデコーダの設計原理を、圧縮の観点から理論的に解釈することを目的とする。
従来のTransformerデコーダ(Segmenter、MaskFormerなど)の構造と問題点を分析する。
セマンティックセグメンテーションと圧縮、特にTransformerデコーダと主成分分析(PCA)との根本的な関連性を論じる。
PCAの目的を符号化レートの観点から拡張し、それを基に、理想的な主部分空間を構築する自己注意機構と、低ランク近似を求める相互注意機構を導出する。
導出した注意機構を用いて、ホワイトボックス型の完全注意型デコーダであるDEPICT (DEcoder for PrIncipled semantiC segmenTation) を提案する。
DEPICTを、従来のブラックボックス型のデコーダであるSegmenterと比較し、性能と解釈可能性を評価する。