本研究では、深層特徴と局所的な質感特徴を融合する手法を提案している。
まず、入力画像からCNNを用いて深層特徴を抽出する。次に、特徴マップを均一なサイズのパッチに分割し、LSTMを用いてパッチ特徴を符号化する。一方で、画像全体の質感特徴をLBPヒストグラムで表現する。最後に、深層特徴とLBP特徴を融合して分類器に入力する。
提案手法は、人物顔、手形状、皮膚病変、料理、自然物など、8つの細粒度画像分類データセットで評価された。DenseNet-201を基盤CNNとして用いた場合、他手法と比べて高い分類精度を達成している。特に、データ拡張手法としてランダムな領域消去を適用することで、精度が向上している。
提案手法の主要コンポーネントの有効性を検証するための実験も行われており、深層特徴とLBP特徴の融合、パッチ数の増加、LSTMの活用などが精度向上に寄与していることが示された。
To Another Language
from source content
arxiv.org
Ключові висновки, отримані з
by Asish Bera,D... о arxiv.org 04-02-2024
https://arxiv.org/pdf/2308.01813.pdfГлибші Запити