Core Concepts
AI検出ツールの正確性は低く、特に非英語母語話者の文章を誤って判断する可能性が高い。これらのツールには限界があり、公平性と包摂性を損なう可能性がある。
Abstract
本研究は、6つの主要なGenerative AI (GenAI)テキスト検出ツールの有効性を、検出を回避するために設計された手法を用いて生成されたマシン生成コンテンツに対して調査したものである。その結果、検出ツールの正確性は元々低く(39.5%)、操作されたコンテンツに直面すると大幅に低下する(17.4%)ことが示された。一部の手法は検出を回避するのに特に効果的であった。
正確性の限界と誤った告発の可能性から、これらのツールを現時点で学術的誠実性違反の判断に使用することはできないと結論付けられた。しかし、非処罰的な方法で学習支援や学術的誠実性の維持に役立つ可能性はある。
これらの結果は、GenAIに対処するための総合的なアプローチの必要性を示している。AI検出ツールの現在の限界を考慮し、高等教育における責任あるかつ公平な利用を促進するための代替策が提案されている。
Stats
元のAI生成サンプルの正確性は39.5%に過ぎない
操作されたコンテンツに直面すると正確性は17.4%まで大幅に低下する
最も効果的な手法を使うと、検出ツールの正確性は12.9%まで下がる
Quotes
"AI検出ツールの正確性の限界と誤った告発の可能性から、これらのツールを現時点で学術的誠実性違反の判断に使用することはできない。"
"これらの結果は、GenAIに対処するための総合的なアプローチの必要性を示している。"