大規模言語モデルを活用したマルチモーダル検索エンジンの可能性を包括的に評価するための「MMSEARCH」ベンチマークを提案し、現行の大規模言語モデルの性能と課題を明らかにする。
本論文は、大規模言語モデルを活用したマルチモーダル検索の新しいアプローチを提案する。これにより、従来のアプローチを大幅に上回る性能を達成している。さらに、大規模言語モデルを対話型の検索アシスタントとして活用することで、自然言語によるユーザーインタラクションを可能にしている。