本論文は、物体検出と数え上げのための一般化フレームワークPseCo を提案する。PseCo は、SAMとCLIPの長所を活かし、物体の位置特定、セグメンテーション、分類の3ステップで物体を検出し数え上げる。