核心概念
映画ポスターから視覚情報とテキスト情報を統合して抽出することで、映画のジャンルを効果的に分類できる。
要約
映画ポスターを用いた複数ジャンル分類に関する研究論文のサマリー
Nareti, U. K., Adak, C., Chattopadhyay, S., & Wang, P. (2024). Unraveling Movie Genres through Cross-Attention Fusion of Bi-Modal Synergy of Poster. arXiv preprint arXiv:2410.19764v1.
本論文では、映画ポスターから視覚情報とテキスト情報の両方を活用し、複数ジャンルに分類する手法を提案しています。従来の研究では、映画の予告編やあらすじを用いたジャンル分類は行われてきましたが、ポスターのみを用いた研究は限られていました。