이 연구는 대형 언어 모델의 정치적 성향을 체계적으로 조사하기 위한 정량적 프레임워크와 파이프라인을 제안한다. 8개의 극단적인 정치적 주제에 걸쳐 조사한 결과, 대형 언어 모델은 보수적이거나 우파적인 관점보다는 진보적이거나 좌파적인 관점에 더 가까운 반응을 제공하는 경향이 있다. 특히 직업, 인종, 정치적 성향과 관련된 세부 정보가 포함된 질문에서 이러한 경향이 두드러졌다. 이러한 발견은 이전 연구에서 관찰된 대형 언어 모델의 좌파적 특성을 재확인할 뿐만 아니라 보수주의로 직접 유도되는 경우에도 이러한 경향이 나타날 수 있음을 보여준다. 이러한 정치적으로 편향된 반응을 방지하기 위해서는 사용자가 질문을 신중하게 구성하고 "중립적"인 프롬프트 언어를 선택해야 한다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究