Основні поняття
네덜란드어 공동 참조 해결 시스템의 성능이 비이진 대명사에 대해 저하되며, 이를 개선하기 위한 데이터 증강 기법의 효과를 입증한다.
Анотація
이 연구는 네덜란드어 공동 참조 해결 시스템의 비이진 대명사 처리 성능을 평가하고 개선하는 것을 목표로 한다.
주요 내용은 다음과 같다:
네덜란드어 공동 참조 해결 시스템의 성능을 성별 대명사와 성중립 대명사로 구분하여 평가한 결과, 성중립 대명사에 대한 성능이 저하되는 것을 확인했다.
성중립 대명사 처리 성능 개선을 위해 두 가지 디바이어싱 기법(Counterfactual Data Augmentation, 디렉시컬라이제이션)을 적용했다. 그 결과 Counterfactual Data Augmentation 기법이 성중립 대명사 처리 성능을 크게 향상시켰다.
Counterfactual Data Augmentation 기법은 적은 양의 데이터로도 효과적으로 적용될 수 있음을 보였다.
기존에 보지 못한 새로운 대명사(neopronouns)에 대해서도 Counterfactual Data Augmentation 기법이 효과적이었다.
이 연구는 네덜란드어 공동 참조 해결 시스템의 비이진 대명사 처리 성능 향상을 위한 실용적인 해결책을 제시한다.
Статистика
성중립 대명사 hen과 die에 대한 공동 참조 해결 성능이 성별 대명사 hij와 zij에 비해 12.51%p 낮았다.
Counterfactual Data Augmentation 기법을 통해 성중립 대명사 처리 성능을 31.88%p 향상시킬 수 있었다.
적은 양의 데이터(전체의 5%)로도 성중립 대명사 처리 성능을 80% 이상 달성할 수 있었다.
Цитати
"네덜란드어 공동 참조 해결 시스템의 성능이 성중립 대명사에 대해 저하되는 것을 확인했다."
"Counterfactual Data Augmentation 기법이 성중립 대명사 처리 성능을 크게 향상시켰다."
"적은 양의 데이터로도 효과적으로 성중립 대명사 처리 성능을 개선할 수 있었다."