本論文では、歩行者検索とクルマ検索の2つのサブタスクに問題を分割し、それぞれに最適な手法を提案することで、CVPR 2023 1st基礎モデルチャレンジ-Track2の課題を解決した。歩行者検索では属性分類とインクルージョン関係マッチングを導入し、クルマ検索ではカラー属性ベースの物体検出手法によるデータ拡張と細粒度な画像-テキスト整合性学習を行った。提案手法は最終的なB-boardテストで0.709の高スコアを獲得した。