Core Concepts
ソーシャルメディアデータを活用して、自然災害の位置特定と被害評価を行うための、名称抽出とトピックモデリングに基づくNLPソリューションを提案する。
Abstract
本研究では、自然災害に関するソーシャルメディアデータの分析に向けて、3つのタスクに取り組んでいる。
関連性分類(RCTP)
ソーシャルメディアの投稿データには、災害関連のキーワードが使われているものの実際には関連性の低い投稿が多数含まれる。
そこで、複数の最新のトランスフォーマーモデルを組み合わせた遅延融合フレームワークを提案し、関連性の高い投稿を自動的に抽出する。
この手法により、F1スコア0.933という高い精度を達成した。
位置情報抽出(LETT)
ソーシャルメディアの投稿にはしばしば位置情報が含まれていないか、実際の災害地域を示していない。
そこで、トランスフォーマーベースのNERフレームワークを用いて、投稿テキストから位置情報/住所を自動的に抽出する。
提案手法は、部分的F1スコア0.9514、完全一致F1スコア0.962と非常に高い精度を示した。
トピックモデリング
大量のソーシャルメディア投稿を手動で分析するのは非常に時間がかかる。
そこで、BERTopicライブラリを用いて、関連性の高い投稿から自動的にトピックを抽出し、キーワードを提示する。
これにより、災害に関する主要な話題や地域ごとの課題を迅速に把握できる。
以上の3つのコンポーネントからなる提案ソリューションは、ソーシャルメディアデータを活用した災害情報分析の実用性を示しており、災害対応の意思決定に役立つ洞察を提供できる。
Stats
災害による年間12,000人の死亡者が発生している
低・中所得国で被害が特に深刻
Quotes
"ソーシャルメディアは災害情報学において非常に有効であることが証明されている。"
"ソーシャルメディアの投稿には多くのノイズが含まれ、災害関連のキーワードが別の文脈で使われていることが多い。"
"ソーシャルメディアの投稿の大部分には地理位置情報が含まれていないか、実際の災害地域を示していない。"