本論文は、Eコマースにおけるスケーラブルな知識グラフ構築のために、商品画像から階層的な知識グラフを自動的に構築する新しい手法を提案しています。
Eコマース分野では、知識グラフはレコメンデーションシステムや質問応答サービスなど、様々なアプリケーションにおいて重要な役割を担っています。しかし、従来のテキストベースの知識グラフ構築は、人手によるラベル付けが必要となるため、コストと時間がかかるという課題がありました。そこで本研究では、商品画像を主要な情報源として活用し、自動的に知識グラフを構築する手法を提案しています。
提案手法では、まず、画像からのテキスト抽出に優れた視覚言語モデル(VLM)を用いて、商品画像から詳細な情報を抽出します。次に、スキーママークアップを用いた複数ターンの対話を通じて、LLMがより多様で詳細な属性や関係を含む商品説明を生成するように誘導します。さらに、最新のLLMを用いて、画像から直接得られないKG関連のプロパティを推論し、既存のリンクを階層的に拡張します。この際、SGLangを用いることで、LLMの応答を構造化されたJSON形式で生成し、出力グラフがスキーマに準拠するようにします。最後に、類似したエンティティ間の冗長性を削減するために、プログラムによるマージを行います。
提案手法の有効性を評価するために、105枚の商品画像からなるデータセットを構築し、ベースライン手法と比較実験を行いました。その結果、提案手法はベースライン手法を上回る精度で、商品画像から知識グラフを構築できることが示されました。
本研究では、商品画像から階層的な知識グラフを自動的に構築する新しい手法を提案しました。提案手法は、Eコマース分野における知識グラフ構築の自動化と効率化に貢献するものです。
本研究は、Eコマース分野における知識グラフ構築の自動化に大きく貢献するものです。提案手法を用いることで、商品情報の更新に迅速に対応できるようになり、より正確で豊富な情報をユーザーに提供することが可能になります。
今後の研究として、低解像度画像への対応や、より複雑な関係性の抽出などが挙げられます。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor