본 연구 논문에서는 대규모 다차원 데이터 세트에서 샘플 모멘트와 일관된 소수의 대표 시나리오를 추출하는 효율적인 알고리즘 두 가지를 제안합니다.
다양한 분야에서 생성되는 다차원 데이터는 정보에 기반한 의사 결정을 위해 효율적인 처리가 필요합니다. 특히 투자, 자산 가격 책정, 금리 요인 구조 분석 등 많은 분야에서 결과의 분산뿐만 아니라 극단적인 결과의 가능성을 나타내는 고차 모멘트 정보 또한 중요합니다. 이러한 정보를 요약하기 위해 많은 양의 데이터 샘플을 신중하게 가중치가 부여된 소수의 시나리오로 대체하는 방법이 주목받고 있습니다.
본 논문에서는 절단 모멘트 문제 (TMP) 및 경험적 모멘트 문제 (EMP) 라는 개념을 기반으로 두 가지 시나리오 추출 알고리즘을 제안합니다.
첫 번째 알고리즘은 Householder Reflections를 활용하여 균일 가중치를 갖는 시나리오를 생성하며, TMP를 균일 측정으로 특수화합니다. 이 알고리즘은 매우 빠르며, 샘플 측정의 모멘트 시퀀스와 2차 모멘트까지 완벽하게 일치하는 일련의 균일하게 분포된 공분산 시나리오를 생성합니다.
두 번째 알고리즘은 EMP를 해결하기 위해 설계되었으며, 목표는 주어진 N개 샘플 세트에서 m « N 체제에서 데이터 샘플의 다항식 모멘트와 충분히 일치하는 m개의 대표 시나리오를 선택하는 것입니다. 특히, 샘플 측정의 지원 세트를 줄여 원자 가중치의 양성 및 정규화를 모두 보장하는 유한 원자 확률 측정을 생성합니다. 제안된 알고리즘은 RKHS에서 데이터 종속 직교 매칭 추적에 대한 계산 솔루션을 제공하며, 따라서 직교 매칭 추적 (OMP)이라고 합니다. 이 알고리즘은 제안된 RKHS의 관련 커널의 Mercer 확장을 사용하여 시나리오 (또는 축소된 측정값의 원자)를 선택하지 않아도 되는 피벗 Cholesky 분해를 기반으로 합니다.
본 논문에서는 제안된 알고리즘의 견고성, 계산 효율성 및 적응성을 보여주는 광범위한 수치 벤치마킹 연구를 수행하고, 포트폴리오 최적화 문제에 적용하여 기존 방법보다 우수한 성능을 보입니다. 또한, 샘플 모멘트 정보만으로 추출된 시나리오가 테일 리스크를 포착하는 능력을 입증합니다. 마지막으로, 압축 센싱 및 머신 러닝 분야에서 표준 접근 방식인 ℓ1-정규화 최소 제곱으로 유
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문