Core Concepts
GPT-4 모델은 인간 평가자보다 금연 의도 파악에 있어 더 일관성 있고 정확한 성능을 보여줌.
Abstract
이 연구는 레딧의 r/QuitVaping 커뮤니티에서 추출한 1,000개의 게시물 중 120개의 샘플 데이터를 활용하여 사용자의 금연 의도를 파악하고자 했다.
먼저 두 명의 인간 평가자가 각 문장을 "금연 의도 있음" 또는 "금연 의도 없음"으로 수동 주석 처리했다. 이를 바탕으로 BERT 기반 언어 모델을 학습시켜 분류 성능을 평가했다.
이와 더불어 GPT-4 모델을 활용해 동일한 문장 주석 작업을 수행했다. 그 결과 GPT-4 모델은 인간 평가자보다 주석 지침을 더 일관성 있게 따르며, 인간이 간과할 수 있는 미묘한 금연 의도도 잘 포착하는 것으로 나타났다.
이는 GPT-4와 같은 대규모 언어 모델이 소셜 미디어 데이터 분석의 정확성과 신뢰성을 높일 수 있음을 시사한다. 향후 연구에서는 더 큰 데이터셋과 다양한 레이블을 활용하여 모델의 성능을 개선할 계획이다.
Stats
레딧 게시물의 제목 평균 문장 수: 1.07개
레딧 게시물의 본문 평균 문장 수: 9.02개
레딧 게시물의 제목 평균 단어 수: 6.56개
레딧 게시물의 본문 평균 단어 수: 157.74개