対話型セグメンテーションモデルの評価において、従来のシミュレーションユーザーは実際のユーザーとの乖離が大きく、モデルの性能を過大評価する傾向がある。本研究では、シミュレーションユーザーとの差異を定量的に評価する指標を提案し、より現実的なシミュレーションユーザーを開発することで、対話型セグメンテーションモデルの評価の信頼性を高めている。