본 논문은 정량적 접두사 독립 목표를 갖는 확률적 게임에서 기댓값 문제를 다룹니다. 저자들은 이 문제를 임계값 부울 목표의 거의 확실한 만족 문제로 축소하는 일반적인 방법을 제시합니다.
핵심 아이디어는 게임의 정점을 각 클래스가 동일한 값을 갖는 정점으로 구성된 소위 값 클래스로 분할하는 것입니다. 이 축소를 통해 플레이어가 기댓값 문제에 대해 최적으로 플레이하는 데 필요한 메모리가 해당 임계값 부울 목표에 대해 거의 확실한 만족 문제에 대해 최적으로 플레이하는 데 필요한 메모리보다 크지 않음을 알 수 있습니다.
저자들은 확률적 게임에서 예상 윈도우 평균 보수 측정값을 계산하기 위해 프레임워크의 적용 가능성을 보여줍니다. 윈도우 평균 보수 측정값은 무한 경로를 따라 슬라이드하는 제한된 길이의 윈도우에서 평균 보수를 계산하여 기존의 평균 보수 측정값을 강화합니다. 두 가지 변형이 고려되었습니다. 한 변형에서는 최대 윈도우 길이가 고정되어 있고 다른 변형에서는 고정되어 있지 않지만 제한되어야 합니다. 두 변형 모두 예상 값이 주어진 임계값 이상인지 확인하는 결정 문제가 UP ∩coUP에 있음을 보여줍니다. 결과는 정점의 예상 값을 추측하고 값 클래스로 분할하고 예상 값에 대한 고유한 짧은 인증서가 있음을 증명함으로써 따릅니다. 또한 플레이어가 최적으로 플레이하는 데 필요한 메모리는 해당 윈도우 목표를 가진 비확률적 2인용 게임의 메모리보다 크지 않습니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문