核心概念
本稿では、データセットを類似性特徴空間にマッピングすることで、機械学習モデルの公平性と精度を向上させる新しい方法論を提案しています。
要約
類似性ネットワークを用いたモデルの公平性と精度の向上:方法論的アプローチ
本研究は、機械学習モデルにおけるバイアスの発生源となるデータセットの特徴を包括的に調査し、公平かつ正確なモデルを達成することを目的とする。
本稿では、データセットの各インスタンス間のペアワイズ類似度に基づいて類似性特徴空間を構築する手法を提案する。この手法は、データ形式に応じて、スケール化指数カーネルやランダムウォークカーネルなどの異なる類似度計算手法を用いる。構築された類似性ネットワークは、その後の機械学習タスク(分類、データ補完、データ拡張など)に活用される。