핵심 개념
본 연구는 칼데론 데 라 바르카의 희곡에서 나타나는 성별 묘사 방식을 전산 분석 기법을 활용하여 규명하고, 이를 통해 문학 작품에 대한 객관적이고 확장 가능한 분석 방법론을 제시한다.
초록
본 연구는 17세기 스페인의 극작가 칼데론 데 라 바르카의 희곡에서 나타나는 성별 묘사 방식을 전산 분석 기법을 활용하여 규명한 연구 논문입니다.
연구 목적
본 연구는 칼데론 데 라 바르카의 희곡에서 나타나는 성별 묘사의 특징을 대규모 말뭉치 분석을 통해 객관적으로 밝히고, 이를 통해 문학 작품에 대한 전산 분석 방법론의 가능성을 제시하는 것을 목적으로 합니다.
연구 방법
연구진은 칼데론 데 라 바르카의 비종교적 희곡 109편을 대상으로 DraCor 프로젝트에서 제공하는 CalDraCor 말뭉치를 활용했습니다. 문장 단위의 성별 분류를 위해 사전 훈련된 다국어 BERT 모델인 BETO를 사용하여 성별 분류기를 구축했습니다. 입력 텍스트의 길이와 집계 방법을 변화시키면서 분류기의 성능을 평가하고, 통합 기울기 방법을 사용하여 분류기의 예측에 영향을 미치는 특징을 분석했습니다.
주요 연구 결과
- 성별 분류:
- 희곡 전체 텍스트를 입력했을 때 분류기의 성능이 가장 우수했으며, 문장 단위 분류 결과를 집계할 때는 다수결 투표보다 기하 평균을 사용하는 것이 더 효과적임을 확인했습니다.
- 특히, 문장 단위 분류 후 기하 평균을 사용하는 경우, 남성 캐릭터뿐만 아니라 여성 캐릭터의 성별 예측 정확도가 향상되어 성별 편향을 줄이는 데 기여할 수 있음을 보였습니다.
- 속성 모델 분석:
- 속성 모델 분석 결과, 분류기는 문법적 특징뿐만 아니라 의미적 특징을 기반으로 성별을 예측하는 것으로 나타났습니다.
- 여성 캐릭터는 관계, 감정과 관련된 단어를 주로 사용하는 반면, 남성 캐릭터는 직위, 전쟁과 관련된 단어를 주로 사용하는 경향을 보였습니다.
- 여장 캐릭터 분석:
- 여장 캐릭터 분석 결과, 분류기는 여장 캐릭터가 남성적인 어투를 사용하는 장면에서는 남성으로 예측하는 경향을 보였습니다.
- 이는 분류기가 단순히 텍스트 표면적인 특징뿐만 아니라 등장인물의 사회적 역할과 맥락까지 고려하여 성별을 예측할 수 있음을 시사합니다.
연구의 의의
본 연구는 칼데론 데 라 바르카의 희곡에서 나타나는 성별 묘사 방식을 대규모 말뭉치 분석과 설명 가능한 AI를 통해 객관적으로 규명했다는 점에서 의의를 지닙니다. 또한, 본 연구는 문학 작품 분석에 전산 분석 기법을 적용하여 기존의 해석학적 연구 방법을 보완하고 확장할 수 있는 가능성을 제시했습니다.
연구의 한계점 및 향후 연구 방향
본 연구는 텍스트 분석에만 초점을 맞추었기 때문에 등장인물 간의 관계, 극적 구조 등을 고려하지 못했다는 한계점이 있습니다. 향후 연구에서는 이러한 한계점을 보완하여 텍스트 분석뿐만 아니라 극의 구조적 특징까지 고려한 심층적인 분석을 수행할 필요가 있습니다. 또한, 본 연구에서 사용한 방법론을 다른 작가의 작품이나 다른 시대적 배경의 작품에 적용하여 그 결과를 비교 분석하는 연구도 의미가 있을 것입니다.
통계
본 연구는 칼데론 데 라 바르카의 비종교적 희곡 109편을 분석했습니다.
총 1515명의 캐릭터 (남성 1021명, 여성 494명)를 분석에 사용했습니다.
남성 캐릭터는 평균 1219개, 여성 캐릭터는 평균 1130개의 토큰을 사용했습니다.
여장 캐릭터 5명을 별도로 분석하여 모델의 성능을 검증했습니다.
인용구
"세 번이나 날 감탄하게 했지만, 세 번 다 내가 누군지 몰랐지. 세 번 다 다른 옷과 모습으로 널 만났으니까. 처음엔 남자라고 생각했겠지. 네 목숨이 내 불행에 대한 아첨이었던 그 끔찍한 감옥에서. 두 번째는 여자라고 생각했을 거야. 네 위엄의 화려함이 꿈이자 환상이자 그림자였을 때. 세 번째는 바로 오늘, 여자와 남자의 모습을 모두 지닌 괴물 같은 모습으로, 여자의 아름다움과 남자의 무기를 두르고 있는 나를 보면서." - 로사우라, "인생은 꿈" 중에서