المفاهيم الأساسية
LLM의 편향된 응답을 해소하기 위해 데이터 생성 과정과 LLM의 추론 과정에 대한 인과관계 모델링을 바탕으로 프롬프팅 전략을 제안한다.
الملخص
이 논문은 LLM(Large Language Model)의 편향된 응답을 해소하기 위한 인과관계 기반 프롬프팅 프레임워크를 제안한다.
- 데이터 생성 과정에 대한 인과관계 모델링:
- 훈련 데이터 코퍼스에는 역사적 차별이 반영되어 있으며, 선택 메커니즘이 관여한다.
- 성별 고정관념, 직업과의 연관성 등은 직접적인 인과관계나 공통 원인이 아닌 선택 메커니즘에 의해 발생한다.
- LLM의 추론 과정에 대한 인과관계 모델링:
- LLM의 내부 표현과 외부 프롬프트 간의 상호작용을 통해 출력이 결정된다.
- 선택 메커니즘이 LLM의 추론 과정에서 핵심적인 역할을 한다.
- 인과관계 기반 프롬프팅 전략:
- 전략 I: 인구통계학적 무관 사실 활용 유도
- 전략 II: 기존 선택 편향 상쇄
- 전략 III: 인구통계학적 정보 활용 회피
이러한 전략들은 LLM의 편향된 추론을 억제하거나 편향 없는 추론을 유도하는 방식으로 작용한다. 실험 결과, 이 프레임워크를 활용한 프롬프팅이 기존 방법들보다 효과적으로 LLM의 편향성을 해소할 수 있음을 보여준다.
الإحصائيات
성별 정보와 직업 간의 연관성은 직접적인 인과관계가 아닌 선택 메커니즘에 의해 발생한다.
LLM의 내부 표현과 외부 프롬프트 간의 상호작용을 통해 출력이 결정된다.
선택 메커니즘이 LLM의 추론 과정에서 핵심적인 역할을 한다.
اقتباسات
"LLM의 편향된 응답을 해소하기 위해 데이터 생성 과정과 LLM의 추론 과정에 대한 인과관계 모델링을 바탕으로 프롬프팅 전략을 제안한다."
"선택 메커니즘이 LLM의 추론 과정에서 핵심적인 역할을 한다."
"인과관계 기반 프롬프팅 전략은 LLM의 편향된 추론을 억제하거나 편향 없는 추론을 유도하는 방식으로 작용한다."