Core Concepts
ESG 평가 기준이 공개되지 않아 언어 모델 학습에 어려움이 있지만, GPT-4를 활용한 프롬프팅, 연쇄 추론, 동적 문맥 학습 등의 전략을 통해 이를 극복하고 ESG 유형 및 영향 기간 분류 성능을 향상시킬 수 있다.
Abstract
이 논문은 ESG(환경, 사회, 지배구조) 요인이 투자 수익률 지표로 널리 채택되고 있으며, 언어 모델을 활용하여 웹 텍스트에서 ESG 신호를 추출하려는 노력이 진행 중이라고 설명합니다. 그러나 최근 접근법은 평가 기준이 기밀로 유지되어 학습 데이터 부족 문제에 시달리고 있습니다.
이 논문은 GPT-4와 같은 최신 언어 모델이 프롬프팅, 연쇄 추론, 동적 문맥 학습 등의 전략을 통해 알려지지 않은 ESG 평가 기준에 맞추어 정렬될 수 있는지 조사합니다. 저자들은 이러한 접근법의 효과를 입증하기 위해 제공된 학습 데이터를 업데이트하지 않고도 한국어 ML-ESG-3 Impact Type 트랙에서 2위를 차지했습니다.
또한 저자들은 프롬프트 조정이 언어 모델의 금융 과제 해결 능력에 어떤 영향을 미치는지 탐구합니다. 일반 사전 학습 기간이 길수록 금융 하위 과제의 성능이 향상된다는 것을 관찰했습니다. 이러한 발견은 언어 모델이 명시적인 학습 예제 없이도 복잡하고 주관적인 평가 지침을 탐색할 수 있는 잠재력을 보여줍니다.
Stats
지속가능 경제 분야에는 258개의 데이터 샘플이 있으며, 이 중 160개가 기회, 57개가 위험, 41개가 구분 불가능한 것으로 나타났습니다.
기업 지배구조 분야에는 205개의 데이터 샘플이 있으며, 이 중 134개가 기회, 31개가 위험, 40개가 구분 불가능한 것으로 나타났습니다.
환경 및 사회 분야에는 156개의 데이터 샘플이 있으며, 이 중 71개가 기회, 79개가 위험, 6개가 구분 불가능한 것으로 나타났습니다.
Quotes
"ESG 평가 기준의 구체적인 방법론은 널리 공개되지 않아 언어 모델을 정확하게 복제하기 위한 세부 지표를 이해하는 데 어려움이 있습니다."
"이 연구는 GPT-4와 같은 최신 언어 모델이 명시적인 학습 데이터 없이도 알려지지 않은 가치(특히 ESG 평가 기준)에 맞추어 정렬될 수 있는지 조사합니다."