Core Concepts
複数のサンプルを用いた動的時間伸縮法を提案し、少数サンプルでのキーワード検出の性能を向上させつつ、計算コストを大幅に削減する。
Abstract
本研究では、キーワード検出のための動的時間伸縮法(DTW)の新しい手法を提案している。従来のDTWでは、各クラスの複数のサンプルを個別に照合する必要があり、計算コストが大きくなる問題があった。
提案手法では以下の4つのステップから成る:
各クラスの参照テンプレートとしてFréchet平均を計算する。
各サンプルを参照テンプレートに合わせて時間軸を変換する。
変換したサンプルの類似度を表す3次元のコストテンサーを作成し、これを2次元のコスト行列に変換する。
各クラスのコスト行列に対してDTWを適用し、クラス毎の類似度スコアを得る。
この手法により、個別のサンプルを全て照合する場合と同等の性能を得ながら、計算コストを大幅に削減できることが実験的に示された。特に、コストテンサーの2次元化を並列処理することで、Fréchet平均を用いる場合とほぼ同等の高速化が実現できる。
Stats
個別のサンプルを全て照合する場合と比べ、提案手法の計算時間は大幅に短縮される。
Fréchet平均を用いる場合と比べ、提案手法の性能は大幅に向上する。
Quotes
"multi-sample DTW yields a very similar performance as using all individual query samples as templates while having a runtime that is only slightly slower than when using Fr´
echet means."
"the runtime only slightly increases with the number of samples and thus is still reasonably close to the optimal runtime."