Core Concepts
本研究の目的は、薬物・アルコールリハビリテーションプログラムを完了するかどうか、およびプログラムに参加する回数を予測することです。オクラホマ州の薬物・アルコールリハビリテーションセンターからの入退院データを使用し、9つの人口統計学的変数の偏りを軽減するために様々な公平性指標を活用しました。カーネル法を含む複数のマシンラーニングモデルを比較し、最適なパラメータを見出しました。
Abstract
本研究では、薬物・アルコールリハビリテーションプログラムの完了予測と参加回数予測を目的としています。オクラホマ州の薬物・アルコールリハビリテーションセンターからの入退院データを使用しました。
データの前処理では以下を行いました:
9つの人口統計学的変数(性別、退役軍人ステータス、婚姻ステータス、教育レベル、年齢、雇用ステータス、妊娠ステータス、人種、民族)の偏りを軽減するために、様々な公平性指標を活用
カテゴリカルデータの合成少数派オーバーサンプリング手法(SMOTEN)を使用してデータのバランスを取り、欠損値を補完
モデリングでは以下を行いました:
線形、多項式、RBF、シグモイドカーネルを使ったサポートベクターマシン
決定木、ランダムフォレスト、ニューラルネットワークなどの手法も比較
公平性の評価では以下の指標を検討しました:
格差影響度、統計的公平性差、条件付き統計的公平性比、人口統計学的公平性、人口統計学的公平性比、等化オッズ、等化オッズ比、等化機会、等化機会比
最終的に、交互作用を考慮した重み付けを行い、最悪ケースの人口統計学的公平性比などの指標を算出しました。
Stats
薬物・アルコールリハビリテーションプログラムを完了した人は全体の約半数である。
参加回数が1回の人が最も多く、3回以上の人は少ない。
人種では白人が最も多く、民族ではヒスパニック/ラテン系が最も多い。
Quotes
"COMPAS アセスメントは人種的に偏っていることが判明しており、このような評価における公平性を考慮することが重要である。"
"オクラホマ州は世界でも有数の高い収監率を持つ地域であり、収監代替としてリハビリテーションの完了を予測することが重要である。"