Core Concepts
ユーザー生成の医薬品レビューの感情分析を通して、医薬品の有効性、副作用、使用経験に関する洞察を得ることができる。
Abstract
本研究では、ユーザー生成の医薬品レビューの感情分析に機械学習手法を適用している。
データの収集:
公開されているWebMDのサイトから5,170件の医薬品レビューを収集し、手動で「ポジティブ」、「ニュートラル」、「ネガティブ」の3つのクラスに分類した。
データ前処理:
収集したデータの不備や欠損値を修正し、分析に適した形式に変換した。
特徴量抽出:
BERT、SciBERT、BioBERT、SBERTなどの事前学習済みモデルを使ってレビューの埋め込み表現を生成した。
機械学習モデル:
決定木、サポートベクターマシン、ランダムフォレスト、ロジスティック回帰などの機械学習アルゴリズムを適用し、感情分類を行った。
各モデルの精度、再現率、F1スコアを比較し、RNNモデルが最も良い性能を示した。
結果と考察:
RNNモデルを用いた場合、ネガティブ、ニュートラル、ポジティブの各クラスに対して、精度がそれぞれ52%、53%、50%であった。
事前学習済みモデルを活用することで、ユーザーの医薬品に対する感情を効果的に分類できることが示された。
今後は、より大規模なデータセットを用いて深層学習モデルを訓練することで、分類精度のさらなる向上が期待できる。
Stats
医薬品レビューの感情分類では、ネガティブクラスの精度が61%、再現率が68%、F1スコアが64%であった。
ニュートラルクラスの精度は38%、再現率は80%、F1スコアは13%と低かった。
ポジティブクラスの精度は45%、再現率は58%、F1スコアは51%であった。
Quotes
"ユーザー生成のデータは、医薬品の有効性、副作用、使用経験に関する洞察を得るための貴重な情報源である。"
"感情分析は、医療や製薬分野において重要性が高まっている。"
"事前学習済みモデルを活用することで、ユーザーの医薬品に対する感情を効果的に分類できる。"