3D物体のキャプションを生成する際、物体の特徴を最もよく表すビューを選択することが重要である。DiffuRankは、事前学習された文字-3D拡散モデルを活用して、各ビューとの整合性を評価し、最適なビューを選択することで、より正確で詳細なキャプションを生成する。