Temel Kavramlar
大規模事前学習言語モデル(PLM)の進歩により、テーマ固有アプリケーションでの検索が向上しました。しかし、特定の領域や産業向けのテーマ固有アプリケーションでは、一意な用語や不完全なコンテキスト、専門的な検索意図によって効果が制限されることがあります。本研究では、コーパストピカルタクソノミーを使用してテーマ固有情報を捉え、検索を改善する方法を提案します。
Özet
大規模な文書検索は大きく進歩しましたが、特定の領域や産業向けのテーマ固有アプリケーションでは、一般的な用語集に含まれていない専門用語やニッチな内容が問題となります。この研究では、コーパストピカルタクソノミーを使用して文書とクエリの中心的トピックを特定し、関連性を補完するためにそれらのトピック関連性を活用するフレームワーク「ToTER」を提案します。ToTERは柔軟に利用できるため、さまざまなPLMベースのリトリバーを強化することが可能です。実世界データセットで行われた包括的な実験により、ToTERを使用した場合においてテーマ固有アプリケーションでの検索におけるトピカルタクソノミー利用の利点とToTERの効果を示すことが確認されました。
İstatistikler
大規模事前学習言語モデル(PLMs)から派生した文書取得は大幅に恩恵を受けています。
テーマ性別応用分野で取得された結果は常に高い再現率です。
ToTERは柔軟かつ効果的です。
コーパストピカルタクソノミーは主題特定情報を捉えるために使用されます。
Alıntılar
"Document retrieval has greatly benefited from the advancements of large-scale pre-trained language models (PLMs)."
"Through extensive quantitative, ablative, and exploratory experiments on two real-world datasets, we ascertain the benefits of using topical taxonomy for retrieval in theme-specific applications and demonstrate the effectiveness of ToTER."