Core Concepts
提案されたAOESモデルは、オントピックのエッセイ採点と非関連エッセイの検出を統合的に行うことができる。
Abstract
本論文では、オントピックのエッセイ例のみを使用して、自動エッセイ採点(AES)システムにおいてオントピックのエッセイ得点を推定し、非関連エッセイを検出するための変換器ベースの統合モデルを提案している。
提案手法の主な特徴は以下の通り:
変換器ベースのAOESモデルに新しいトピック正規化モジュール(TRM)を追加し、ハイブリッドな損失関数を使用して学習する。これにより、オントピックのエッセイ採点と非関連エッセイの検出を統合的に行うことができる。
マハラノビス距離スコアを使用した非関連エッセイ検出手法を提案する。これにより、追加の非関連データを必要とせずに、非関連エッセイを効果的に検出できる。
2つのエッセイデータセット(ASAP-AES、PsyW-Essay)を用いた実験評価により、提案手法がベースラインや従来手法を上回る性能を示すことを確認した。
様々な敵対的な攻撃に対する頑健性も確認しており、提案手法が人為的な攻撃に対しても効果的に非関連エッセイを検出できることを示した。
Stats
非関連エッセイを含むデータセットでは、提案手法のマハラノビス距離スコアが、ベースラインの単語移動距離スコアよりも、オントピックとオフトピックの分布の重複が小さい。
提案手法は、AddSpeech、BabelGenerate、RepeatSent、ReplaceSents、GPTGenerateなどの敵対的な攻撃に対して、高いF1スコア、精度、再現率を示した。
Quotes
"多くの研究では、AESシステムが関連性の低い回答に低い得点を付けられないことを示している。したがって、自動エッセイ採点における非関連回答の検出は、受験者が与えられた課題とは無関係なテキストを書く実践的なタスクにおいて重要である。"
"提案するAOESモデルは、トピック正規化モジュール(TRM)を使用し、提案したハイブリッドな損失関数を使用して学習する。これにより、エッセイの採点と非関連エッセイの検出を統合的に行うことができる。"