المفاهيم الأساسية
Transformer-based models can be affected by sequence length learning, leading to reliance on non-textual features for classification.
الإحصائيات
モデルはオリジナルのトレーニングセットで高い精度を達成する。
長さが不均衡なトレーニングセットでモデルは低い精度を示す。
اقتباسات
"Models seem to capture sequence length as a classification spurious feature."
"The more the distributions overlap, the lesser the problem."