Core Concepts
데이터셋 증강과 편향 정량화를 통해 제한된 산업군에서의 대규모 언어 모델 편향을 감소시킬 수 있다.
Abstract
이 논문은 대규모 언어 모델(LLM)의 편향 문제를 해결하기 위한 방법을 제안한다. 특히 데이터가 제한적인 "제한된 산업군"에 초점을 맞추었다.
데이터셋 증강: 편향 생산자(bias producer) 개념을 사용하여 데이터셋을 자동으로 증강한다. 이를 통해 외부 데이터에 의존하지 않고도 데이터셋의 다양성을 높일 수 있다.
편향 정량화:
mb-index: LLM의 성능과 편향을 함께 고려하는 지표
db-index: 데이터셋의 편향 정도를 측정하는 지표
실험 결과, 제안된 데이터셋 증강 방법을 통해 데이터셋의 편향이 감소하였고, 이를 통해 fine-tuning된 LLM의 편향 또한 감소하였다.
이를 통해 제한된 산업군에서 편향이 낮은 LLM을 개발할 수 있을 것으로 기대된다.
Stats
원본 데이터셋 Sample A의 db-index는 0.56이었으나, 증강 후 0.49로 감소하였다.
원본 데이터셋 Sample B의 db-index는 0.71이었으나, 증강 후 0.65로 감소하였다.
LLM A의 mb-index는 2.16 x 10^-3, LLM B의 mb-index는 7.65 x 10^-4였다.
LLM C와 LLM D의 mb-index는 각각 1.36 x 10^-3, 5.24 x 10^-4로 LLM A와 LLM B보다 낮았다.