本論文は、画像-テキストマッチングの課題に取り組むための新しい深層ブースティング学習(Deep Boosting Learning, DBL)アルゴリズムを提案している。
まず、アンカーブランチを訓練して、データの特性や分布に関する洞察を得る。その上で、ターゲットブランチに適応的な margin制約を課すことで、マッチングペアと不マッチングペアの相対距離をさらに拡大させる。
提案手法は、固定マージンを用いる相対ブースティング戦略と絶対ブースティング戦略の2つのバリエーションを持つ。前者は、アンカーブランチで学習した相対距離に基づいて適応的なマージンを設定し、後者は、アンカーブランチの絶対距離を参照して、マッチングペアを近づけ、不マッチングペアを遠ざけるための明示的なマージンを設定する。
広範な実験により、提案手法が様々な最新の画像-テキストマッチングモデルに対して一貫して優れた性能を発揮し、関連する協調学習手法を上回ることが示された。さらに、同じ計算コストで高い汎用性を持つことも確認された。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Haiwen Diao,... kl. arxiv.org 04-30-2024
https://arxiv.org/pdf/2404.18114.pdfDybere Forespørgsler