실세계 문제에서는 다차원 과제 수행과 미래 가용성에 대한 영향을 균형 잡아야 하며, 환경 내 다른 에이전트와 강화 학습 에이전트 자체에 대한 안전을 보장해야 한다. 본 연구에서는 이를 위해 쌓인 보편적 후계자 특징 근사기(SUSFAS)를 제안하며, 이는 이차 목표에 대한 성능을 향상시키고 안전 제어기와의 상호작용을 개선한다.