Основні поняття
라벨링된 RF 데이터의 부족을 해결하기 위해 비전 기반 기반 모델(FM)에서 지식을 추출하여 RF 기반 인간 활동 인식(HAR) 시스템을 향상시키는 교차 모달 프레임워크인 FM-Fi를 소개합니다.
Анотація
FM-Fi: 소규모 데이터를 위한 대규모 모델 - 교차 모달 RF 기반 인간 활동 인식을 위한 기반 모델
본 연구 논문에서는 라벨링된 데이터 부족이라는 RF 기반 HAR의 문제점을 해결하기 위해 고안된 FM-Fi라는 새로운 교차 모달 프레임워크를 제시합니다. FM-Fi는 방대한 양의 데이터로 훈련된 기반 모델(FM)의 역량을 활용하여 RF 기반 HAR 시스템을 개선합니다.
FM-Fi의 주요 구성 요소는 다음과 같습니다.
- RF 인코더: RF 포인트 클라우드에서 정보를 효과적으로 인코딩합니다.
- 교차 모달 CKD(Contrastive Knowledge Distillation): 시각적 특징 맵에서 RF 기반 모델로 의미 표현을 전이하기 위한 새로운 지식 증류 메커니즘입니다. 기존 KD 방식과 달리, CKD는 FM 임베딩 간의 상호 의존성을 고려하여 RF 모델이 FM의 구조적 특징을 학습할 수 있도록 합니다.
- 외부 특징 제거 모듈: HAR과 관련 없는 외부 특징(예: 배경 잡음)을 제거하여 모달 간의 정렬을 개선합니다. FM의 의미 공간을 활용하여 시각적 특징의 점수를 매기고, RF 모달의 물리적 특성을 탐색하여 정적 및 동적 배경을 필터링합니다.
- 제로샷 HAR 메커니즘: 학습된 RF 및 텍스트 모달 간의 연관성을 기반으로 레이블링된 데이터 없이도 HAR을 수행합니다.
- 메트릭 기반 퓨샷 학습 네트워크: 제한된 수의 레이블링된 샘플을 사용하여 특정 HAR 작업에 신속하게 적응하도록 RF 인코더를 미세 조정합니다.
본 논문의 주요 연구 결과는 다음과 같습니다.
- FM-Fi는 제로샷 및 퓨샷 HAR 작업 모두에서 높은 성능을 달성했습니다.
- CKD 메커니즘은 FM에서 RF 모달로 지식을 효과적으로 전이하는 것으로 나타났습니다.
- 외부 특징 제거는 모달 간의 정렬을 개선하고 HAR 성능을 향상시키는 데 중요한 역할을 했습니다.
결론적으로 FM-Fi는 다음과 같은 이점을 제공합니다.
- 라벨링된 RF 데이터 부족 문제 해결
- 비전 기반 FM의 지식과 RF 센싱의 이점을 결합
- 제로샷 및 퓨샷 학습 시나리오에서 높은 HAR 정확도 달성
본 연구는 RF 기반 HAR 분야에 상당한 기여를 하며, 향후 스마트 홈, 디지털 헬스케어, 인간-컴퓨터 상호 작용과 같은 다양한 분야에서 광범위하게 활용될 수 있을 것으로 기대됩니다.
Статистика
FM-Fi는 제로샷 학습에서 72.5%의 정확도를 달성했습니다.
1-shot 및 3-shot 학습의 경우 FM-Fi는 각각 86.0% 및 94.4%의 정확도를 달성했습니다.
ViT-B/32를 교사 모델로 사용했을 때 제로샷 HAR 작업에서 79.7%의 정확도를 달성했습니다.
CKD 데이터 샘플 수가 10,000개에서 90,000개로 증가함에 따라 제로샷 정확도가 증가했습니다.
모델 매개변수 수가 증가함에 따라 FM-Fi의 제로샷 정확도가 향상되어 매개변수 수가 700만 개에 도달했을 때 77%의 최고점에 도달했습니다.
피사체에서 센서까지의 거리가 2m일 때 최적의 성능인 76.7%를 달성했습니다.
피사체가 센서를 직접 향했을 때(0° 각도) 정확도가 76.7%로 정점을 찍었습니다.
Цитати
"라벨링된 RF 데이터의 부족은 RF 센싱을 사용하는 HAR 작업을 크게 제한합니다."
"FM의 포괄적인 지식과 제로샷 기능은 RF 센싱에서 레이블이 지정된 데이터의 고유한 부족을 극복하는 데 중요할 수 있으며 RF-HAR을 개방형 인식으로 끌어올릴 수 있는 잠재력도 있습니다."
"대부분의 기존 FM은 주로 컴퓨터 비전(CV) 및 자연어 처리(NLP)의 작업을 위해 개발되었으므로 RF-HAR에 직접 적용하는 데 제한이 있습니다."