본 논문은 미시 및 거시 표현 탐지를 위한 약한 감독 기반의 프레임워크를 제안한다. 기존의 완전 감독 방식은 프레임 단위 레이블링이 필요하여 많은 시간이 소요되는 문제가 있고, 약한 감독 방식은 위치 및 개수 정보가 부족하여 성능이 낮은 문제가 있다.
제안하는 방법은 각 표현 구간에서 임의의 단일 프레임만을 레이블로 사용하는 약한 감독 방식을 도입한다. 이를 위해 다음과 같은 핵심 기술을 개발하였다:
다중 정제 의사 레이블 생성(MPLG) 알고리즘: 클래스 확률, 주의 점수, 현재 특징, 단일 프레임 레이블을 융합하여 더 신뢰할 수 있는 의사 레이블을 생성한다.
분포 기반 특징 대비 학습(DFCL) 알고리즘: 메모리 뱅크를 활용하여 전체 데이터셋 수준의 글로벌 특징 표현을 학습한다.
실험 결과, 제안 방법은 최근 완전 감독 방식과 유사한 성능을 달성하였다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Wang-Wang Yu... في arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14240.pdfاستفسارات أعمق