Kernekoncepter
マルチモーダルLLMを活用することで、大規模な製品検索システムの評価を迅速かつ低コストで行うことができる。
Resumé
本論文では、大規模な製品検索システムの評価を効率的に行うためのマルチモーダルLLMベースのフレームワークを提案している。
主な特徴は以下の通り:
- クエリごとに自動生成された注釈ガイドラインを活用することで、評価の一貫性と解釈可能性を高めている。
- 製品の textual description と visual description を組み合わせることで、より正確な関連性評価を行うことができる。
- キャッシングと並列処理を組み合わせることで、大規模な評価を迅速かつ低コストで実行できる。
- 人間アノテーターとLLMの比較分析から、LLMは大量のアノテーションに適しており、人間の専門性はより複雑なケースに活用できることが示された。
本フレームワークを実際の大規模eコマースプラットフォームに適用した結果、人間アノテーターと同等の品質を実現しつつ、大幅なコストと時間の削減に成功した。また、オフラインでの評価結果を活用して、検索システムの改善にも役立てている。
Statistik
人間アノテーターと比較して、LLMベースの評価は約100-1000倍安価である。
20,000件の全アノテーションを完了するのに、人間アノテーターは約3週間を要したのに対し、LLMは約20分で完了した。
Citater
"LLMsは大量のアノテーション作業に適しており、人間の専門性はより複雑なケースに活用できる。"
"本フレームワークを実際の大規模eコマースプラットフォームに適用した結果、人間アノテーターと同等の品質を実現しつつ、大幅なコストと時間の削減に成功した。"