弱教師付きビデオ異常検知のための新しい擬似ラベル生成と自己学習フレームワークを提案する。CLIP言語-視覚モデルを利用して、ビデオイベントの説明文とビデオフレームの整合性を高め、正常性ガイダンスに基づいて信頼性の高い擬似ラベルを生成する。さらに、時間的依存関係を柔軟かつ正確にモデル化するための時間コンテキスト自己適応学習モジュールを導入する。