核心概念
ペルシャ語の感情分析において、ハイブリッドなアプローチが優れた性能を発揮する。
要約
この研究では、ペルシャ語の感情分析におけるハイブリッド深層学習モデルが導入され、Digikala Online Retailerの顧客レビューデータを使用してテストされました。3つの感情カテゴリー(ポジティブ、ネガティブ、ニュートラル)に対して適用されたこの研究は、多くの他の研究がポジティブとネガティブのみに焦点を当てる中で異なるアプローチを取っています。
Abstract:
- ペルシャ語で最も困難な領域であるセンチメント分析において、豊富なデータから洞察を抽出するために深層学習技術が好まれている。
- Digikala Online Retailerウェブサイトから得られた顧客レビューデータを使用し、センチメント分析向けのハイブリッド深層学習モデルを導入・実装した。
- 3つのセンチメントカテゴリー(ポジティブ、ネガティブ、ニュートラル)で78.3%のF1スコアを達成。
Introduction:
- オンラインコミュニケーションプラットフォームへのアクセス増加により、大量のテキストデータが生成されており、その分析は様々な目的に役立つ。
- Digikalaはペルシャ語自然言語処理とテキストマイニング向けの貴重なデータ源となっている。
Background:
- ペルシャ語文書レビュー用データセットへの深層学習技術適用や新しいアーキテクチャ開発が進行中。
- 深層学習技術は長期依存関係を学ぶLSTMや局所特徴抽出用CNNsなどで高い精度を達成している。
Dataset:
- Digikala Online Retailer Open Data Mining Programから提供された10万件以上のペルシャ語顧客レビューから構成されるデータセット。
- データは15単語以下である90%以上の文章から構成されており、処理可能性と一貫性確保のため15単語未満とすることが決定された。
...
統計
ハイブリッド手法はF1スコア78.3%を達成した。
DashtipourらはDeep Auto EncodersとDeep CNNs組み合わせて効率改善し82.86%精度達成。
BokaeeNezhadらはCNNsとLSTMs組み合わせWord2vec利用し85%精度達成。