Core Concepts
本研究は、製品の暗示的な属性値を抽出するための初の公開マルチモーダルデータセット「ImplicitAVE」を開発し、様々なマルチモーダル大言語モデル(MLLM)のベンチマークを行った。
Abstract
本研究は、製品の属性値抽出(AVE)に関する課題に取り組んでいる。従来のAVEデータセットは主に明示的な属性値に焦点を当てており、暗示的な属性値を無視していた。また、製品画像を含まず、公開されていないものが多かった。
そこで本研究では、ImplicitAVEと呼ばれる初の公開マルチモーダルデータセットを開発した。ImplicitAVEは、MAVEデータセットから収集したデータを精査・拡張したものであり、暗示的な属性値抽出とマルチモーダリティを含んでいる。最終的に、5つのドメインにわたる68,604件の訓練データと1,610件のテストデータから成る高品質なデータセットが構築された。
さらに、ImplicitAVEデータセットを用いて、6つの最新のMLLMモデルの11のバリアントのベンチマークを行った。その結果、暗示的な属性値抽出は依然としてMLLMにとって課題であることが明らかになった。
本研究の主な貢献は以下の通りである:
暗示的な属性値抽出のための初の公開マルチモーダルデータセットImplicitAVEの開発と公開
暗示的な属性値抽出に対するMLLMのパフォーマンスの探索と包括的なベンチマーク、および今後の研究方向性の提示
Stats
製品のタイトルに「透明防水」「カワイイ」といった単語が含まれていることから、製品の「ブーツスタイル」が「レインブーツ」であると推測できる。
製品画像からも「レインブーツ」であることが分かる。
Quotes
「暗示的な属性値は製品テキストに明示的に記載されておらず、製品画像、文脈上のヒント、または事前知識から推測する必要がある」
「既存のAVEデータセットは主に明示的な属性値に焦点を当てており、暗示的な属性値を無視している」