本研究では、文化的要素を含むキャプションを生成するための新しいフレームワーク「Culturally-aware Image Captioning (CIC)」を提案しています。
CICでは以下の3つのステップを行います:
この方法により、従来のイメージキャプショニングモデルでは捉えきれなかった文化的要素を含むキャプションを生成することができます。
人間評価の結果、CICが生成したキャプションは、4つの文化グループ(西洋、南アジア、アフリカ、東アジア)の参加者から高い評価を得ました。
これは、CICが文化的要素を適切に抽出し、それを反映したキャプションを生成できていることを示しています。
To Another Language
from source content
arxiv.org
Viktige innsikter hentet fra
by Youngsik Yun... klokken arxiv.org 05-03-2024
https://arxiv.org/pdf/2402.05374.pdfDypere Spørsmål