Core Concepts
Tunisian social networksにおけるコロナウイルスパンデミックなどのトピックに焦点を当て、ARIMA時系列分析を用いて進化するトピックトレンドを解読する方法論。
Abstract
研究者が提案した新しい方法論は、多言語トピックダイナミクスの解読とコミュニケーショントレンドの特定に優れている。
チュニジア社会ネットワーク内での対話に焦点を当て、コロナウイルスパンデミックやスポーツ、政治などの注目すべきテーマに関連するコメントからなる多様な多言語コーパスを集約。
No-English-to-English機械翻訳アプローチが言語差異を処理し、高い精度とF1スコアを示すことが示された。
LDAおよびHDPモデルが使用され、翻訳されたコンテンツから適切なトピックを抽出するために応用される。
ARIMA時系列分析が進化するトピックトレンドを解読するために適用される。
1. Introduction
During the Coronavirus pandemic, social media platforms have become crucial for instant information exchange and public communication. However, the diverse linguistic environment within social media poses challenges in crisis communication.
2. Related Works
Monolingual topic models are efficient but insufficient for capturing cross-lingual topics. Multilingual topic models are more complex but accommodate cross-lingual topics.
3. Proposed Methodology
The approach involves data collection, preprocessing, No English-to-English Machine Translation, topic modeling using LDA and HDP algorithms, and trends identification through ARIMA time series analysis.
Stats
No data metrics provided in the content.
Quotes
No striking quotes found in the content.