本研究は、製品の属性値抽出(AVE)に関する課題に取り組んでいる。従来のAVEデータセットは主に明示的な属性値に焦点を当てており、暗示的な属性値を無視していた。また、製品画像を含まず、公開されていないものが多かった。
そこで本研究では、ImplicitAVEと呼ばれる初の公開マルチモーダルデータセットを開発した。ImplicitAVEは、MAVEデータセットから収集したデータを精査・拡張したものであり、暗示的な属性値抽出とマルチモーダリティを含んでいる。最終的に、5つのドメインにわたる68,604件の訓練データと1,610件のテストデータから成る高品質なデータセットが構築された。
さらに、ImplicitAVEデータセットを用いて、6つの最新のMLLMモデルの11のバリアントのベンチマークを行った。その結果、暗示的な属性値抽出は依然としてMLLMにとって課題であることが明らかになった。
本研究の主な貢献は以下の通りである:
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問