Core Concepts
본 연구는 고차원 편미분 적분 방정식(PIDE)을 해결하기 위해 시간 차이 학습 기반의 딥러닝 프레임워크를 제안한다. 레비 과정을 도입하고 강화 학습 모델을 구축하여 PIDE의 해를 신경망으로 근사화한다. 시간 차이 오차, 종료 조건, 비국소 항의 특성을 손실 함수에 포함하여 신경망을 학습한다. 이를 통해 계산 비용이 낮고 수렴 속도가 빠르며 정확도가 높은 방법을 제시한다.
Abstract
본 연구는 고차원 편미분 적분 방정식(PIDE)을 해결하기 위한 시간 차이 학습 기반의 딥러닝 프레임워크를 제안한다.
PIDE와 레비 과정 도입:
PIDE 문제를 레비 과정 기반의 전방-후방 확률 미분 방정식 시스템으로 표현
해의 근사를 위해 신경망을 활용
강화 학습 모델 구축:
PIDE 해를 강화 학습의 가치 함수로 간주
상태 과정, 보상 과정, 전이 확률 등을 정의하여 강화 학습 모델 수립
시간 차이 학습 기반 최적화:
시간 차이 오차, 종료 조건, 비국소 항의 특성을 손실 함수에 포함
각 시간 단계에서 손실 함수를 계산하고 최적화 수행
전체 궤적 시뮬레이션 없이 매 단계 업데이트 가능
수치 실험 결과:
1차원 순수 점프 문제에서 10^-4 수준의 오차 달성
100차원 문제에서 10^-3 수준의 오차 달성
계산 비용이 낮고 수렴 속도가 빠르며 다양한 점프 형태에 강건한 성능 확인
본 연구는 고차원 PIDE 문제를 효과적으로 해결할 수 있는 새로운 접근법을 제시한다.
Stats
100차원 문제에서 Y0의 상대 오차는 0.548%이다.
100차원 문제의 계산 시간은 약 10분이다.