本研究では、CLIPモデルを使用してラベルに注意したデータの整列を行い、汎用的な特徴を取得します。さらに、ジェネリックおよびドメイン固有のプロンプトを学習して画像テキストペアを分類します。提案されたDPODはこの難しい社会的に重要な多モーダル偽ニュース検出タスクで最先端の性能を達成します。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Debarshi Bra... lúc arxiv.org 03-11-2024
https://arxiv.org/pdf/2311.16496.pdfYêu cầu sâu hơn