Core Concepts
SSLモデルは、MDDとPTSDの検出においてタスクアゴスティックな特性を示す。
Abstract
自己監督学習(SSL)は、MDDとPTSDの検出において効果的な表現を生成するために探求されている。
SSLモデルは、固定された複数のターゲットまたはマスクフレームを予測してトレーニングされる。
PASEとAALBERTモデルは、MDDとPTSDの検出において改善されたパフォーマンスを提供し、タスクアゴスティックな特性を示す。
オーディオモダリティではPASE-modエンコーダーが優れた結果を示し、ビデオモダリティではAALBERTエンコーダーが最適な結果を提供する。
これらのSSLモデルから生成されたグローバル表現は、タスクアゴスティックな目的に使用できる。
SSL Models:
PASE: ローカライズされた表現からグローバル表現へ変換することでMDDおよびPTSDの検出パフォーマンスが向上した。
AALBERT: ビデオモダリティで使用され、異なるトランスフォーマー層数によって最適な結果が得られた。
Baselines:
DepAudioNetやLSTMベースのベースラインよりもSSLモデルが優れた結果を提供した。
Results:
オーディオとビデオ両方でSSLモデルが有効であり、タスクアゴスティックな特性を持つことが示唆されている。
Stats
"この研究では、PASE-modエンコーダーがMDD検出パフォーマンスを10.65%向上させました。"
"AALBERTエンコーダーはビデオモダリティで最適な結果を提供しました。"