대화형 언어 모델의 출력물에 대한 독성 점수 기반 필터링은 소수 집단에 대한 차별적 결과를 초래할 수 있다. 이에 사용자가 개인별 허용 수준을 설정할 수 있는 재발권 메커니즘을 제안하여, 사용자의 언어 재발권을 지원하고자 한다.
사용자가 언어 모델의 출력에 대한 개인적 허용 수준을 설정할 수 있는 메커니즘을 제공함으로써 언어 재발권을 증진시킬 수 있다.