Core Concepts
이모지 설명과 사용 맥락을 활용하여 감성 분석 기반 이모지 사전을 자동으로 생성할 수 있다.
Abstract
이 연구는 이모지 설명과 사용 맥락을 활용하여 감성 분석 기반 이모지 사전을 자동으로 생성하는 방법을 제안한다.
주요 내용은 다음과 같다:
이모지가 포함된 비정형 텍스트와 이모지 설명을 수집한다.
비정형 텍스트와 이모지 설명에 대해 감성 분석을 수행한다. 이때 의존 관계 기반의 비지도 학습 방식인 USSPAD 기법을 활용한다.
이모지 설명의 감성 점수와 비정형 텍스트에서의 이모지 사용 맥락을 종합하여 이모지 감성 사전을 자동으로 생성한다.
실험 결과, 이모지 설명과 사용 맥락을 활용한 접근법이 기존 방식에 비해 우수한 성능을 보였다. 이는 이모지 설명과 사용 맥락이 감성 분석에 유용한 정보를 제공한다는 것을 보여준다.
Stats
"이모지는 약 20억 개가 트위터에서 사용되고 있으며, 새로운 이모지가 유니코드 버전마다 계속 등장하고 있다."
"이모지는 약 74%의 미국 인구와 82%의 중국 인구가 사용하고 있다."
Quotes
"이모지는 단어, 표정, 목소리 단서 등이 없는 상황에서 감정을 표현할 수 있는 수단이다."
"이모지의 의미는 플랫폼마다 다를 수 있어 해석이 어려울 수 있다."