핵심 개념
본 논문에서는 DEMON 스펙트럼을 활용하여 물체의 축 주파수 또는 블레이드 수에 대한 강력한 정보를 제공하는 DEMONet을 제안하며, 이를 통해 기존 수중 음향 인식 시스템의 환경 및 모션 변화에 대한 취약성을 개선하고, 실제 환경에서의 성능과 강건성을 향상시키는 것을 목표로 한다.
초록
DEMONet: 다중 전문가 네트워크 및 교차 시간 변이 자동 인코더 기반 수중 음향 표적 인식
수중 음향 표적 인식은 해양 음향학에서 중요한 부분을 차지하며, 수중 환경의 복잡성과 표적의 동적 움직임으로 인해 실제 환경에서 강력한 시스템을 구축하는 데 어려움을 겪고 있다. 본 논문에서는 DEMONet이라는 새로운 접근 방식을 제안하여, DEMON 스펙트럼을 활용하여 표적의 축 주파수 또는 블레이드 수에 대한 강력한 정보를 제공한다. DEMONet은 DEMON 스펙트럼을 기반으로 다양한 수중 신호를 가장 적합한 전문가 계층에 할당하는 다중 전문가 네트워크이다. 또한, DEMON 특징에서 노이즈 및 허위 변조 스펙트럼을 완화하기 위해 교차 시간 정렬 전략을 도입하고 변이 자동 인코더(VAE)를 사용하여 노이즈에 강한 DEMON 스펙트럼을 재구성한다.
3.1 전처리 및 특징 추출
수신된 음향 데이터는 빔형성 알고리즘을 사용하여 단일 채널 오디오 신호로 합성된 후, 저주파 간섭 및 중복 고주파 성분을 제거하기 위해 대역 통과 필터를 적용한다.
필터링된 신호는 시간-주파수 스펙트로그램(STFT 진폭 스펙트로그램, 멜 스펙트로그램, CQT 스펙트로그램)과 DEMON 스펙트럼을 공동으로 추출하여 DEMONet의 입력으로 사용한다.
DEMON 스펙트럼은 신호의 변조 특성을 분석하여 표적의 고유한 물리적 특징(프로펠러 축 주파수 및 블레이드 주파수)을 나타낸다.
3.2 프레임워크 및 학습 과정
DEMONet은 교차 시간 VAE, 라우팅 계층, 여러 전문가 계층 및 백본 네트워크의 네 가지 주요 구성 요소로 구성된다.
교차 시간 VAE는 서로 다른 기간에 속하는 동일한 신호 레코딩의 DEMON 스펙트럼을 재구성하도록 훈련되어 노이즈 또는 허위 변조 스펙트럼 라인의 영향을 줄인다.
라우팅 계층은 DEMON 특징에서 제공하는 물리적 특징을 기반으로 입력 신호를 가장 적합한 전문가 계층에 할당한다.
전문가 계층은 공통 특성을 가진 데이터로부터 학습을 전문으로 수행하며, 활성화된 전문가 계층은 입력 특징을 중간 표현으로 변환하여 백본 네트워크로 보낸다.
백본 네트워크는 중간 표현을 예측 확률로 변환하고, 최종 손실 함수는 인식 작업 손실과 부하 균형 손실의 조합으로 표현된다.
3.3 세부 아키텍처
교차 시간 VAE는 인코더와 디코더로 구성되며, 인코더는 입력을 잠재 변수의 추정 평균 및 분산으로 변환하고 디코더는 가우시안 잠재 변수를 기반으로 대