核心概念
時間的コンテキストを考慮することで、従来のクラスター型ビデオサマリゼーション手法の限界を克服し、効果的なサマリを生成する。
要約
本論文では、TAC-SUMと呼ばれる新しい無監督型ビデオサマリゼーションアプローチを提案する。従来のクラスター型手法の限界を克服するため、時間的コンテキストを考慮することに焦点を当てている。
具体的には以下の通り:
入力ビデオをクラスター情報を用いて時間的に連続したセグメントに分割する。これにより、クラスタリングプロセスに時間的な意識を注入することができる。
得られた時間的に意識されたクラスターを利用して、簡単なルールに基づきキーフレームの選択と重要度スコアの付与を行う。
SumMeデータセットでの実験結果から、提案手法が既存の無監督手法を大きく上回り、最新の教師あり手法とも匹敵する性能を示すことを確認した。
統計
ビデオの総フレーム数は T 個である。
サンプリングされたフレーム数は ˆ
T 個である。
クラスター数は K 個に設定されている。
最終的な partition の数は ˆ
N 個である。