반자동 의미 정렬 매칭 변환기를 이용한 효율적인 테이블 검출
본 연구는 최소한의 레이블 데이터를 사용하여 문서 객체(테이블 및 텍스트)를 정확하고 효율적으로 검출하는 접근법을 제안한다. 이 접근법은 학생-교사 네트워크를 활용하여 학습 과정에서 상호 업데이트를 수행한다. 이전 변환기 기반 연구는 주의 집중 메커니즘 개선 또는 객체 쿼리 수 증가에 초점을 맞추었지만, 이는 학습 시간과 성능에 영향을 미친다. 우리는 NMS가 필요 없도록 하고 객체 쿼리와 이미지 특징 간의 매칭에 초점을 맞춘다. 반자동 설정에서 SAM-DETR을 사용하는 우리의 새로운 접근법은 객체 쿼리와 대상 특징을 정렬하여 문서 객체 검출의 정확도를 크게 향상시킨다.