이 논문은 장면 그래프 생성 모델의 성능을 평가하기 위한 지표들을 상세히 검토하고 정의한다. 기존 연구에서 사용된 지표들의 정의가 명확하지 않았지만, 이 논문에서는 Recall@k, Mean Recall@k, Pair Recall@k 등의 지표를 엄격하게 정의하고 의사 코드로 설명한다. 또한 이러한 지표들을 효율적으로 구현한 SGBench라는 Python 패키지를 제공한다. SGBench는 기존 구현보다 가볍고 사용하기 쉬우며, 모든 논의된 지표를 지원한다.
추가로 이 논문은 다양한 장면 그래프 생성 모델들을 제안된 지표로 평가하고 비교한다. 이를 통해 모델의 성능을 종합적으로 분석할 수 있다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Tiefere Fragen