本研究では、人間活動認識(HAR)における実世界の課題に取り組む。具体的には、ラベル不足と単一モダリティ制約の問題に着目している。
まず、監督学習によるマルチモーダル融合の影響を調査し、モダリティ間の相関と各モダリティ固有の特徴空間の重要性を明らかにした。
次に、MESEN(Multimodal-Empowered Unimodal Sensing)を提案した。MESENは、無ラベルのマルチモーダルデータを活用して、クロスモーダル特徴の対照学習とマルチモーダル擬似分類アラインメントを統合した多タスク学習メカニズムを採用する。これにより、ユニモーダルな特徴を効果的に抽出し、少数のラベルでユニモーダルなHARを実現する。
MESENは8つの公開マルチモーダルデータセットで評価され、ベースラインと比較して平均30.7%の精度向上と34.5%のF1スコア向上を達成した。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問