Główne pojęcia
ニュースに報告されるソフトウェア障害を自動的に収集、分析、要約することで、ソフトウェア工学の実践と研究、政策立案、教育に役立てる。
Streszczenie
本研究では、ニュースに報告されるソフトウェア障害を自動的に収集、分析、要約するFAILシステムを提案しています。
FAILは以下のような流れで動作します:
- 検索キーワードとニュースソースを使ってニュース記事を収集する
- 記事がソフトウェア障害について報告しているかを判断する
- 記事に障害分析に十分な情報が含まれているかを判断する
- 同一の障害について報告している記事をまとめる
- 長い記事の場合はRetrival-Augmented Generationを使って対応する
- 障害の詳細情報(原因、影響、対策など)を抽出する
FAILを使って2010年から2022年までの137,427件のニュース記事を分析した結果、2,457件の個別の障害事例を特定し、詳細な分析を行いました。
主な知見は以下の通りです:
- 同様の障害が同一組織内や複数組織間で繰り返し発生していることが多い
- 障害の深刻度(人的被害、物的被害、活動の遅延など)が過去10年で増加傾向にある
- 情報、交通、金融、政府の分野で障害が多く発生している
これらの知見は、ソフトウェア工学の実践と研究、政策立案、教育に活用できると考えられます。また、FAILデータベースを公開することで、より広範な分析が可能になります。
Statystyki
推定1,500人の利用者が重複課金された
10万人の教師らの社会保障番号が漏洩した
Cytaty
"ソフトウェアの障害は工学分野全体に影響を及ぼし、年間数兆ドルの損失を引き起こしている"
"ニュースは障害の原因、影響、教訓などの情報を含んでおり、ソフトウェア工学の実践と研究に役立つ"