강화 학습 문제에서 불공정성의 근원을 인과 관계 분석을 통해 체계적으로 탐구하고, 동적 공정성이라는 새로운 인과적 공정성 개념을 제안하여 불공정성을 설명하고 감소시키는 방법을 제시한다.