Основные понятия
マガヒ・ヒンディー語・英語(MHE)コード混合言語の感情分析用の新しいデータセット、MaCMSを紹介します。
Аннотация
この論文では、マガヒ・ヒンディー語・英語(MHE)コード混合言語の感情分析用の新しいデータセットであるMaCMSを紹介しています。このデータセットは、マガヒがリソースが少ない少数言語であり、感情分析タスク向けの最初のマガヒ・ヒンディー語・英語コード混合データセットです。さらに、コード混合の構造を理解するためにデータセットの言語学的分析と、異なる極性を持つ話者の言語選好を理解するための統計的研究も提供しています。これらの分析に基づいて、データセットの品質を評価するために基準モデルもトレーニングしています。
Статистика
データ数:11000コメントから5663コメントに削減
データセット内で肯定的なタグ:37.4%
データセット内で否定的なタグ:33.8%
Цитаты
"Sentiment analysis seeks to understand people’s emotions and attitudes towards various subjects."
"Code-mixing involves using multiple languages within a single conversation or text."
"The dataset provides insights into the language preferences of speakers with different polarities."