Core Concepts
MaskSearchは、機械学習モデルによって生成された画像マスクデータベースに対する効率的な検索クエリを提供し、モデルの説明、攻撃の検出、人間の注意と機械の注意の差異の調査などの用途をサポートする。
Abstract
本デモンストレーションでは、MaskSearchシステムの概要を説明する。MaskSearchは、画像マスクに基づいた検索クエリを効率的に実行するためのシステムである。
MaskSearchのデータモデルでは、画像マスクをテーブルとして表現し、マスクのメタデータ(画像ID、モデルID、マスクタイプなど)と実際のマスクデータ(2D浮動小数点配列)を保持する。
MaskSearchは、フィルタクエリ、トップK クエリ、集計クエリなどの検索クエリをサポートする。これらのクエリでは、マスク内の特定の範囲の画素数をカウントする関数(CP関数)を使用して、マスクの特性に基づいて画像を検索できる。
MaskSearchは、Cumulative Histogram Index (CHI)と呼ばれる新しいインデックス手法を導入し、クエリ実行時の効率化を図っている。CHIは、空間位置と画素値の組み合わせに対する累積ヒストグラムを保持し、任意の領域と画素値範囲に対する上限と下限を効率的に計算できる。
本デモンストレーションでは、3つのシナリオを通して、MaskSearchのGUIを使ってユーザが直接操作し、MaskSearchの機能と性能を体験できる。
シナリオ1では、画像分類モデルのデバッグに利用する例を示す。モデルが背景の雑音に注目していることを発見し、関連のない画素をランダム化することで、モデルの性能を改善する。
シナリオ2では、敵対的攻撃の検出に利用する例を示す。モデルの注意が拡散しているマスクを効率的に検索することで、攻撃された画像を特定する。
シナリオ3では、モデルの注意と人間の注意の差異を調査する例を示す。マスクの集約クエリを使って、両者の注意の重複度が最も低い画像を効率的に検索する。
Stats
モデルの予測精度は0.5であり、146番目のクラス(Meleagris Ocellata)の画像が17番目のクラス(Panthera Onca)に誤分類されている。