Core Concepts
유튜브 동영상 제목만으로도 정치적 성향을 정확하게 분류할 수 있는 혁신적인 BERT 기반 분류기를 제안한다.
Abstract
이 연구는 유튜브 동영상 제목을 이용하여 정치적 성향을 탐지하는 혁신적인 BERT 기반 분류기를 제안한다. 기존 연구들은 주로 신문 기사나 소셜미디어 데이터를 활용했지만, 이 연구는 유튜브 동영상 제목을 활용했다는 점에서 차별화된다.
연구팀은 Word2Vec, GloVe, BERT 등 3가지 언어 모델을 fine-tuning하여 분류기를 개발했다. 이 중 BERT 기반 분류기가 가장 우수한 성능을 보였는데, 정확도 75%, F1 점수 77%를 달성했다. 이는 기존 분류기들을 크게 앞선 수준이다.
또한 연구팀은 15개 유명 뉴스 채널의 동영상 제목을 수집하여 분류기로 분석했다. 대부분의 경우 분류기의 예측 결과가 각 채널의 실제 정치적 성향과 일치했다. 이를 통해 제안된 분류기가 실제 유튜브 동영상의 정치적 성향을 정확하게 탐지할 수 있음을 검증했다.
이 연구는 유튜브 동영상의 정치적 성향을 자동으로 탐지할 수 있는 실용적인 도구를 제공한다. 향후 이 분류기를 활용하면 유튜브 채널의 정치적 편향성을 분석하거나, 개인화된 추천 시스템을 구축하는 데 활용할 수 있을 것으로 기대된다.
Stats
유튜브 동영상 제목 데이터셋에는 약 1,000만 개의 동영상이 포함되어 있다.
이 데이터셋은 6개의 정치적 성향 범주(극좌, 좌, 중도, 반-진보, 우, 극우)로 레이블링되어 있다.
Quotes
"유튜브는 미국 성인의 4분의 1이 정기적으로 뉴스를 얻는 곳으로, 온라인 뉴스 소스 중 두 번째로 많이 이용되고 있다."
"BERT는 양방향 문맥 표현을 학습할 수 있어 텍스트 분류에 탁월한 성능을 보인다."