Core Concepts
ソーシャルメディアの投稿を自動収集・分析することで、水質に関する市民の即時的なフィードバックを得ることができる。
Abstract
本研究では、水質分析のための重要な社会的課題に取り組んでいる。水の提供と水質の確保は、社会の経済的・社会的発展にとって重要な要因の1つであり、常に公的機関の最優先事項の1つとなっている。水質を確保するために、オフラインおよびオンラインのサーベイなどさまざまな監視・評価方法が使用されている。しかし、これらのサーベイには参加者数の制限や頻度の低さなどの課題がある。
本研究では、ソーシャルメディアの投稿を自動的に収集・分析することで、データに基づいた意思決定を行うためのNLPフレームワークを提案している。このフレームワークは、(i)テキスト分類と(ii)トピックモデリングの2つのコンポーネントから構成されている。テキスト分類では、複数の大規模言語モデル(LLM)を組み合わせたメリット融合フレームワークを提案し、重み付け最適化手法を用いている。トピックモデリングでは、BERTopicライブラリを使用して、水関連のツイートに潜在するトピックパターンを発見している。また、異なる地域や国から発信されたツイートを分析し、グローバル、地域、国別の課題や水関連の懸念事項を探っている。さらに、将来の研究に役立つよう、大規模なデータセットを収集・手動で注釈付けしている。
Stats
水質汚染により、2017年には約160万人が下痢性疾患で亡くなり、そのうち3分の1が5歳未満の子供だった。
水質汚染の主な原因は、プラスチック、農業肥料、医薬品などの化学汚染物質である。
プランクトンの量は1940年代から半減したと考えられていたが、スコットランドの研究によると、実際には90%も減少していることが明らかになった。
Quotes
水なくして生命は存在し得ない。水を節約しよう。水を守ろう。一滴一滴が、地球上で生きられる日数を増やすことになる。
汚染された水を飲むと、コレラ、下痢、赤痢、腸チフスなどの疾患を引き起こす可能性がある。