Główne pojęcia
本研究は、多タスク監督を拡散モデルに組み込むことで、ピクセル単位の分割タスクの識別能力と汎化性を向上させる。また、時間的依存性を捉えるために、前フレームから目標フレームを再構築する時間推論モジュールを提案し、さらに敵対的自己教師学習戦略を採用して、より現実的なフレームを生成する。
Streszczenie
本研究は、ポリープの高いカムフラージュと冗長な時間的手がかりに取り組むために、拡散モデルベースのネットワークDiff-VPSを提案する。
主な特徴は以下の通り:
-
多タスク監督を拡散モデルに組み込むことで、分割タスクの識別能力と汎化性を向上させる。分類とオブジェクト検出のタスクを同時に行うことで、高レベルのセマンティック情報を活用する。
-
時間的依存性を捉えるために、前フレームから目標フレームを再構築する時間推論モジュールを開発する。さらに、敵対的自己教師学習戦略を採用して、より現実的なフレームを生成し、動的な手がかりをより良く捉えることができる。
-
大規模なSUN-SEG動画ポリープデータセットで実験を行い、提案手法がState-of-the-Artの性能を達成することを示す。特に、見慣れた場面と見慣れない場面の両方で優れた結果を得ている。
Statystyki
ポリープの分類カテゴリは、Low-grade adenoma、High-grade adenoma、Hyperplastic polyp、Traditional serrated adenoma、Sessile serrated lesion、Invasive carcinomaの6種類である。
動画ポリープデータセットSUN-SEGには、100の陽性ケースと13の陰性ケースが含まれ、合計49,136フレームのポリープフレームと109,554フレームの非ポリープフレームがある。
Cytaty
"Diffusion Probabilistic Modelsは、コンピュータビジョンのコミュニティで最近大きな注目を集めている。しかし、拡散ベースの研究の大部分は生成タスクに焦点を当てており、ポリープ分割の結果を前進させる拡散モデルの研究はない。"
"ポリープの高いカムフラージュと冗長な時間的手がかりは、動画ポリープ分割(VPS)の主要な課題である。"