Core Concepts
BiSeNetFormer는 두 개의 효율적인 스트림 아키텍처를 활용하여 다양한 이미지 분할 작업을 수행할 수 있는 효율적인 다중 작업 모델이다.
Abstract
이 논문은 효율적이고 다중 작업 지원이 가능한 이미지 분할 모델 BiSeNetFormer를 제안한다. BiSeNetFormer는 기존의 두 개의 스트림 구조를 활용하여 공간 정보와 문맥 정보를 효과적으로 결합한다. 또한 변환기 기반의 분할 헤드를 사용하여 다양한 분할 작업(의미론적 분할, 전체적 분할)을 수행할 수 있다.
실험 결과, BiSeNetFormer는 기존의 다중 작업 모델들에 비해 훨씬 빠른 추론 속도를 보이면서도 경쟁력 있는 정확도를 달성했다. 특히 저사양 하드웨어에서도 실시간 성능을 보여주었다. 이를 통해 BiSeNetFormer가 효율성과 다중 작업 적응성의 균형을 잘 이루고 있음을 확인할 수 있다.
Stats
시티스케이프 데이터셋에서 BiSeNetFormer(STDC2 백본)는 47.8 FPS의 속도로 57.3의 PQ 점수를 달성했다.
ADE20K 데이터셋에서 BiSeNetFormer(STDC2 백본)는 99.7 FPS의 속도로 30.8의 PQ 점수를 달성했다.
Quotes
"BiSeNetFormer는 두 개의 효율적인 스트림 아키텍처를 활용하여 다양한 이미지 분할 작업을 수행할 수 있는 효율적인 다중 작업 모델이다."
"실험 결과, BiSeNetFormer는 기존의 다중 작업 모델들에 비해 훨씬 빠른 추론 속도를 보이면서도 경쟁력 있는 정확도를 달성했다."