提案手法は、テキスト情報を活用した視覚-テキスト対比学習を用いて、微表情認識の性能を大幅に向上させる。さらに、視覚情報に基づいて動的にプロンプトを生成するAdaptive promptingモジュールを導入することで、コンテキスト情報を効果的に取り入れている。また、微表情認識の結果を感情理解に活用する際、テキスト予測が他のモダリティよりも優れた性能を示すことを実証的に明らかにしている。