核心概念
医薬品の有害事象を自動的に検出するための知識拡張グラフニューラルネットワークの重要性と効果を示す。
要約
医薬品の有害事象(ADE)検出は重要であり、テキストデータから自動化された方法が探求されている。
論文では、医学的知識を取り入れた異種テキストグラフと概念に注意したアテンションメカニズムを提案し、ADE検出性能を向上させることが示されている。
実験結果は、提案手法が他の先進的な手法よりも競争力があることを示している。
グラフ構築プロセスでは、異なる計算方法(L1距離、L2距離、コサイン距離、PMI)を使用してエッジの重み付けを行い、データセット特性に応じて最適な方法を選択する必要があることが明らかになっている。
医薬品関連データセット
SMM4H: 2,418文書(ADE 1,209件)
TwiMed-Pub: 1,000文書(ADE 191件)
TwiMed-Twitter: 625文書(ADE 232件)
CADEC: 7,474文書(ADE 2,478件)
グラフアーキテクチャ比較結果
データセットサイズによって最適なグラフアーキテクチャが異なり、DGCNNは大規模データセットで優れたパフォーマンスを発揮する一方で、小規模データセットではGCNやGATが優れている。
概念に注意したアテンション効果
概念に注意したアテンションはF1スコアで最も優れており、異種グラフ内の異なるタイプのノードを区別し豊かな表現力を持つことが示されている。
統計
最適化手法:Adamオプティマイザー
学習率:LR=2e´5〜1e´3
隠れ次元数:200〜400
引用
"Recent studies have applied word embedding and deep learning-based natural language processing to automate ADE detection from text."
"Our contributions are thus summarized as follows: We introduce medical knowledge to augment the contextualized graph embedding model for representation learning on drug adverse events."