本研究では、ツイートデータを用いて5つの主要なうつ病タイプ(双極性うつ病、非定型うつ病、精神病性うつ病、major抑うつ障害、産後うつ病)を検出することを目的としている。
まず、これらのうつ病タイプに関連するキーワードを用いてツイートをスクレイピングし、データセットを構築した。次に、文脈を考慮しながら手動でツイートにラベルを付けた。
前処理では、ハッシュタグ、URL、@、句読点の除去、小文字化などを行った。英語以外のツイートや、スパムや重複したツイートは除外した。
その後、BERTを用いて特徴抽出と学習を行い、機械学習・深層学習モデルを構築した。さらに、説明可能AIを用いて、モデルがどのようにして各うつ病タイプを予測しているかを説明した。
結果として、BERTモデルが最も優れた性能を示し、全体的な精度は0.96に達した。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문