แนวคิดหลัก
FOND 계획에서 정책 공간 탐색 성능을 향상시키기 위해 정책 등가성 개념을 소개하고, 구조적 상태 공간 대칭성을 활용하여 등가성 탐지를 강화하며, 조기 교착 상태 제거와 만족적 탐색 기법을 적용하고, 솔루션 압축 기법을 제안한다.
บทคัดย่อ
이 논문은 FOND(Fully-Observable Non-Deterministic) 계획에서 정책 공간 탐색 성능을 향상시키기 위한 다양한 기법을 소개한다.
- 정책 등가성 개념 소개
- 정책 등가성을 통해 정책 공간 탐색 공간을 줄일 수 있다.
- 세 가지 정책 등가성 개념을 제시: 레인 등가성, 도메인-프론티어 등가성, 구조적 대칭성 기반 등가성
- 레인 등가성은 각 상태에서 도달할 수 있는 미매핑 상태 집합이 같은 정책을 등가로 간주한다.
- 도메인-프론티어 등가성은 도메인과 프론티어 집합이 같은 정책을 등가로 간주한다. 이를 위해 다항식 시간 내에 솔루션 정책을 구성할 수 있는 concretizer 절차를 제안한다.
- 구조적 대칭성 기반 등가성은 상태 공간의 구조적 대칭성을 활용하여 등가성 탐지를 강화한다.
- 조기 교착 상태 제거와 만족적 탐색 기법 적용
- 조기 교착 상태 제거와 만족적 탐색 기법(Weighted A*, Greedy Best-First Search)을 AND* 알고리즘에 적용한다.
- 솔루션 압축 기법 제안
- 완전 상태 기반 솔루션 정책을 부분 상태 기반 정책으로 압축하는 compressor 절차를 제안한다.
이러한 기법들을 적용한 AND* 알고리즘은 기존 FOND 계획 알고리즘에 비해 생성 정책 수가 평균 2배 감소하고, 솔루션 압축성도 향상되었다.
สถิติ
FOND 계획 문제에서 솔루션을 찾기 위해 생성되는 정책의 수는 평균 2배 감소했다.