本論文では、長尾分布の異常検出(AD)の問題に取り組んでいる。従来のAD手法は、クラス間のサンプル数が均等であることを前提としていたが、実際の製造現場では、製品の人気度などの理由から、クラス間のサンプル数に大きな偏りが生じる長尾分布が自然に生じる。このような長尾分布の設定下では、従来手法の性能が大幅に劣化することが示されている。
そこで本論文では、長尾分布のADタスクを定義し、評価指標を提案している。さらに、この問題に対処するため、新しいAD手法LTADを提案している。LTADは、再構築による異常検出と意味的な異常検出の2つのモジュールから構成される。再構築モジュールは、トランスフォーマーベースの再構築モジュールを用いて実装されている。意味的な異常検出モジュールは、学習可能な疑似クラス名と事前学習済みの基盤モデルを利用した2値分類器によって実装されている。
LTADの学習は2段階で行われる。第1段階では、疑似クラス名と特徴量合成用のVAEを学習する。これにより、長尾分布への対処と、基盤モデルに整合的な特徴表現の学習を行う。第2段階では、再構築モジュールと分類モジュールのパラメータを学習する。
実験では、提案手法LTADが、従来手法に比べて、ほとんどの長尾分布設定で優れた性能を示すことが確認された。特に、意味的な異常検出モジュールの導入が大きな効果を発揮することが示された。また、LTADは、クラス順序に依存せずに安定した性能を発揮することも確認された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Chih-Hui Ho,... at arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.20236.pdfDeeper Inquiries