核心概念
AIpomは、デコーダーモデルとエンコーダーモデルのパイプラインを組み合わせることで、人間生成テキストと機械生成テキストの境界を効果的に検知する。
要約
本論文では、SemEval-2024 Task 8のサブタスクCである人間生成テキストと機械生成テキストの境界検知に取り組むAIpomシステムを提案している。
AIpomのパイプラインは以下の通り:
デコーダーモデルを訓練し、機械生成テキストの予測を行う
デコーダーの予測結果を元に、人間生成テキストと機械生成テキストの境界を示すトークンを挿入する
1つ目のエンコーダーモデルを、デコーダーの予測結果を使って訓練する
2つ目のエンコーダーモデルを、訓練データとデコーダーの予測結果を組み合わせて訓練する
2つのエンコーダーモデルの予測結果を平均化して最終的な境界位置を出力する
実験の結果、デコーダーとエンコーダーを組み合わせたパイプラインが、個別のモデルよりも優れた性能を示すことが分かった。また、ドメインシフトの問題があり、開発データと公式評価データの間で大きな性能差が見られた。今後の課題として、モデルのロバスト性向上が挙げられる。
統計
人間生成テキストと機械生成テキストの境界位置の平均絶対誤差(MAE)は15.94であった。
開発データでのMAEは1.68であったが、公式評価データでは15.21と大きく低下した。