核心概念
拡散ベースの画像編集技術を用いて現実的な悪条件下でのデータセットを構築し、セマンティックセグメンテーションモデルのロバスト性を評価する。
要約
Cityscape-Adverse: 拡散ベースの画像編集による現実的なシーン変更を用いたセマンティックセグメンテーションのロバスト性ベンチマーク
本稿では、セマンティックセグメンテーションモデルの、悪天候、照明条件の変化、季節の移り変わりといった、現実世界における様々な環境条件下でのロバスト性を評価するための新しいベンチマーク「Cityscape-Adverse」を紹介する。
データセットの作成と評価方法
Cityscape-Adverseは、既存の都市景観データセットであるCityscapesを基に、拡散ベースの画像編集技術を用いて、雨、霧、春、秋、冬(雪)、晴れ、夜、夜明けの8つの異なる環境条件をシミュレートしたものである。
各環境条件に対して、"天気を雨に変える"、"季節を雪の降る冬に変える"、"街灯のついた夜景に変える"といったように、拡散モデルに指示を与えるためのプロンプトを設定し、", photo-realistic" を追記することで、現実的な画像生成を目指した。
生成された合成画像は、セマンティックセグメンテーションのラベルの整合性を保つために、人間によるフィルタリングを行い、リアリティとセマンティックの整合性を両立させた高品質なデータセットを構築した。
実験と結果
本研究では、CNNベースのモデル(DeepLabV3+、ICNet、DDRNet)とTransformerベースのモデル(SegFormer、SETR、Mask2Former)を用いて、Cityscape-Adverseデータセットにおけるセマンティックセグメンテーションの性能評価を行った。
その結果、CNNベースのモデルは悪条件下では顕著な性能低下が見られたのに対し、Transformerベースのモデルはより高いロバスト性を示した。
さらに、Cityscape-Adverseデータセットで学習したモデルは、実際の悪条件下でのデータセットに対しても、ロバスト性が向上することが確認された。
Cityscape-Adverseは、セマンティックセグメンテーションモデルのロバスト性を評価するための、より現実的で多様な条件を備えたベンチマークである。
本研究の結果は、拡散ベースの画像編集技術が、現実世界のデータ収集が困難な場合に、効果的な代替手段となりうることを示唆している。