대규모 언어 모델에 내재된 성 편향을 인과 관계 분석을 통해 찾아내고, 이를 기반으로 한 지식 편집 기반 방법론을 통해 효과적으로 완화할 수 있다.
대규모 언어 모델에 내재된 성 편향을 효과적으로 탐지하고 완화하는 방법을 제안한다.