핵심 개념
본 논문에서는 레딧에서 나타나는 인간 가치관을 대규모로 분석하여 온라인 커뮤니티 연구에 활용할 수 있는 방법론을 제시합니다.
초록
온라인 커뮤니티에서 나타나는 인간 가치관 분석: 레딧을 활용한 대규모 연구
본 연구는 레딧에서 나타나는 인간 가치관을 대규모로 분석하여 온라인 커뮤니티 연구에 활용할 수 있는 방법론을 제시합니다. 슈워츠의 인간 가치 이론을 기반으로, 레딧 사용자들의 게시물 및 댓글 데이터에서 가치관의 존재 여부와 그에 대한 태도를 분석하는 모델을 개발하고, 이를 통해 12,000개 이상의 레딧 커뮤니티에서 나타나는 가치관을 분석했습니다.
데이터 수집 및 처리
2022년 1월부터 8월까지 Pushshift API를 이용하여 레딧 게시물 및 댓글 데이터 수집
10단어 미만, 10개 미만의 '좋아요'를 받은 게시물/댓글은 분석에서 제외
NSFW 태그가 붙은 커뮤니티, 구독자 5,000명 미만, 250개 미만의 게시물/댓글을 가진 커뮤니티 제외
대규모 커뮤니티는 1,000개의 게시물/댓글을 무작위로 추출하여 분석에 활용
영어 이외의 언어로 작성된 게시물/댓글 제외
가치관 추출 모델 학습 및 평가
슈워츠 가치 관련성 분류 모델 학습: ValueNet 및 ValueArg 데이터셋 활용, DeBERTa 모델 기반
슈워츠 가치 태도 분류 모델 학습: ValueNet 데이터셋 활용, DeBERTa 모델 기반
모델 평가: 레딧 게시물/댓글 데이터에 대한 수동 평가를 통해 모델의 정확도 측정
레딧 커뮤니티별 가치관 분석
각 커뮤니티에서 나타나는 슈워츠 가치 관련성 및 태도 점수 계산
커뮤니티 유사도 측정: 가치관 유사도, 의미론적 유사도, 커뮤니티 구성원 중복 비율을 기반으로 측정