本研究は、製品の属性値抽出(AVE)に関する課題に取り組んでいる。従来のAVEデータセットは主に明示的な属性値に焦点を当てており、暗示的な属性値を無視していた。また、製品画像を含まず、公開されていないものが多かった。
そこで本研究では、ImplicitAVEと呼ばれる初の公開マルチモーダルデータセットを開発した。ImplicitAVEは、MAVEデータセットから収集したデータを精査・拡張したものであり、暗示的な属性値抽出とマルチモーダリティを含んでいる。最終的に、5つのドメインにわたる68,604件の訓練データと1,610件のテストデータから成る高品質なデータセットが構築された。
さらに、ImplicitAVEデータセットを用いて、6つの最新のMLLMモデルの11のバリアントのベンチマークを行った。その結果、暗示的な属性値抽出は依然としてMLLMにとって課題であることが明らかになった。
本研究の主な貢献は以下の通りである:
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문