本研究では、GPT-3.5およびGPT-4のバイアスを特定するための新しい手法を提案している。言語的・地理的に異なる地域の政治的態度と、それらの地域で生成されたGPTの出力を比較することで、バイアスの源泉を特定している。
具体的には、中絶と カタルーニャ独立の2つの政治的イシューについて、スウェーデン語、ポーランド語、英語、カタロニア語、スペイン語の5つの言語でGPTの出力を収集・分析した。
その結果、以下の2つの知見が得られた。
トレーニングデータのバイアスが、GPTの出力に反映されている。スウェーデンの出力はより自由主義的、ポーランドの出力はより保守的である。同様に、カタロニア語の出力はより独立支持的、スペイン語の出力はより反対的である。
GPT-4のフィルタリングは一部のバイアスを除去するが、新たなバイアスも生み出している。中絶に関してはGPT-4の出力がより自由主義的になり、カタルーニャ独立に関してはより支持的な傾向がみられる。
これらの結果は、AIモデルの訓練データの質と、アルゴリズムのデザインの重要性を示唆している。単純なフィルタリングでは根本的なバイアスを解消できず、むしろ新たなバイアスを生み出す可能性がある。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Christina Wa... um arxiv.org 09-11-2024
https://arxiv.org/pdf/2409.06043.pdfTiefere Fragen