Główne pojęcia
本研究では、環境に関連するツイートデータセット「EcoVerse」を作成し、環境関連性の分類、環境への影響分析、スタンス検出の3つのタスクを同時に実行するための新しい注釈スキームを提案する。
Streszczenie
本研究では、環境に関連するツイートデータセット「EcoVerse」を作成しました。このデータセットには3,023件の英語ツイートが含まれ、幅広い環境トピックをカバーしています。
データセットの作成プロセスは以下の通りです:
- ツイートの収集: 環境関連のハッシュタグや環境団体のアカウントなどから、2019年1月から2023年6月までのツイートを収集しました。
- データのクリーニング: 重複ツイートの除去、短すぎるツイートの除外などの前処理を行いました。
- 3段階の注釈スキームの開発:
- 環境関連性の分類(環境関連/非環境関連)
- 環境への影響分析(肯定的/否定的/中立的)
- スタンス検出(支持的/中立的/懐疑的/反対的)
- 2人の注釈者による注釈作業: 注釈ガイドラインに基づき、高い一致率で注釈を行いました。
- 分類実験: BERT系モデルを用いて、3つのタスクの分類実験を行いました。結果、環境関連性分類では高精度を達成しましたが、環境影響分析とスタンス検出では改善の余地があることがわかりました。
本研究の主な貢献は以下の通りです:
- 環境関連トピックを広範囲にカバーする初の注釈付きデータセットの作成
- 環境への影響分析という新しい分析パラダイムの提案
- 環境関連テキストの分析に特化したモデルの必要性を示唆
Statystyki
環境破壊の速度は警告すべき水準に達している。
1,000種以上の哺乳類が絶滅危惧種に指定されている。
有機農業により土壌侵食と水質汚濁が減少したという。
南アフリカの気候と持続可能な農業慣行により、食品の残留物質レベルが低い。
Cytaty
「気候変動は人為的起源であることが証明されている」
「環境保護のための行動を起こすことが喫緊の課題である」
「有機農業は単なるトレンドに過ぎず、緑の狂信に乗じているだけだ」