Core Concepts
自然言語とアイテムを結びつけるBLAIRモデルは、推薦タスクにおいて強力なテキストとアイテム表現能力を示す。
Abstract
この論文では、BLAIRという事前学習された文埋め込みモデルが紹介されています。BLAIRは、アイテムメタデータとユーザーレビューを共に捉え、製品の検索や推薦に使用されます。AMAZON REVIEWS 2023という新しいマルチドメインレビューデータセットも導入され、これまで公開されている最大規模のアイテムプールを提供しています。実験では、以前のPLMとBLAIRのパフォーマンスを包括的に評価し、BLAIRがゼロショット設定で全体的に優れたパフォーマンスを達成することが示されています。
Stats
AMA-ZON REVIEWS 2023は570百万以上のレビューと4800万以上のアイテムからなる新しいデータセットです。
BLAIRはコントラスト目的でトレーニングされた一連の文埋め込みモデルです。
BLAIRはRoBERTaをバックボーンモデルとして使用しており、特定のペアリングオブジェクトでトレーニングされています。
BLAIRは主に教師付きコントラスト損失関数を使用してトレーニングされます。
データ処理では、30文字未満のコンテキストまたはアイテムメタデータを持つトレーニングインスタンスがフィルタリングされます。
Quotes
"Language is an important modality for describing and showcasing products in e-commerce platforms."
"We introduce a new task, complex product search, which retrieves items given complex natural language contexts."
"Our main contributions are collecting an extensive dataset named AMAZON REVIEWS 2023 and presenting BLAIR, a series of sentence embedding models pre-trained over user reviews and item metadata pairs."