본 논문은 스케치 의미 분할을 위한 효과적인 접근법인 ContextSeg를 제안한다. 이 방법은 두 단계로 구성된다.
첫 번째 단계에서는 스트로크의 형상 및 위치 정보를 더 잘 인코딩하기 위해 밀도 거리 필드 예측을 제안한다. 이를 통해 스트로크의 구조적 정보를 강화할 수 있다.
두 번째 단계에서는 자기 회귀 Transformer를 사용하여 한 번에 하나의 스트로크 그룹에 레이블을 지정한다. 이를 통해 이전에 레이블이 지정된 스트로크와 아직 레이블이 지정되지 않은 스트로크와 같은 문맥 정보를 완전히 활용할 수 있다.
실험 결과, 제안된 ContextSeg는 대표적인 두 데이터셋에서 최고의 분할 정확도를 달성했다. 또한 데이터 불균형 문제 해결을 위한 새로운 데이터 증강 기법과 cross-category 학습에 대한 예비 실험 결과를 제시하여 향후 연구에 영감을 줄 수 있다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Jiawei Wang,... at arxiv.org 03-27-2024
https://arxiv.org/pdf/2311.16682.pdfDeeper Inquiries