本論文は、動画セマンティックセグメンテーションのための局所的および全体的な時間的コンテキストの学習手法を提案する。提案手法は、隣接フレームの静的コンテキストと動的コンテキストを統一的に表現するCoarse-to-Fine Feature Mining (CFFM)技術と、全体的な時間的コンテキストを明示的に学習するCFFM++を含む。実験結果は、提案手法が既存手法を上回る性能を達成することを示している。