แนวคิดหลัก
深層学習モデルのトレーニングにおいて、データの質と量は重要な要素であり、特に文脈的な多様性を考慮したデータ選択が、モデルの精度、効率性、公平性を向上させるために重要である。
บทคัดย่อ
深層学習モデルの効率的なトレーニングのための文脈的曖昧性の活用
本稿は、ICVGIP'21会議の議事録に掲載された論文「Exploiting Contextual Uncertainty of Visual Data for Efficient Training of Deep Models」の要約です。
深層学習モデルの性能は、学習データの量と質に大きく依存します。特に、現実世界におけるオブジェクトの文脈的な配置や関係性を反映したデータを用いることが重要となります。本研究では、視覚データの文脈的曖昧性に着目し、深層学習モデルの効率的なトレーニング手法を提案しています。
本稿では、以下の3つの貢献について述べられています。
文脈的多様性に基づくアクティブラーニング (CDAL)
従来のアクティブラーニング手法では、視覚的多様性や予測の不確実性に基づいて学習データを選択していましたが、空間的な文脈の変化を捉えることができませんでした。
本稿では、空間的に共起するクラスに関連する混乱を捉える「文脈的多様性」という概念を導入し、多様なオブジェクトクラスとその空間的な共起をカバーするトレーニングセットを選択することで、CNNの汎化性能を向上させることを提案しています。
文脈的に公平なデータによるモデルバイアスの削減
学習データセットにおける共起バイアスは、現実世界における未知のシナリオに対するDNNモデルの汎化能力を低下させる可能性があります。
本稿では、保護された属性に対する様々なクラスとの共起に関して公平なサンプルのサブセットを選択することで、データセットにおける文脈的バイアスに対処する新しいデータ修復アルゴリズムを提案しています。
アクティブドメイン適応のための文脈的クラス
アクティブドメイン適応 (ADA) では、アクティブラーニング (AL) を使用してターゲットドメインから画像のサブセットを選択し、それらにアノテーションを付けて教師ありドメイン適応 (DA) に使用します。
本稿では、フレームが与えられると、モデルが正確に予測するのが最も難しいクラスのセットを特定し、選択されたフレーム内で意味的に意味のある領域にアノテーションを付けることを推奨するADA戦略を提案しています。