Основные понятия
Transformer-based models can be affected by sequence length learning, leading to reliance on non-textual features for classification.
Статистика
モデルはオリジナルのトレーニングセットで高い精度を達成する。
長さが不均衡なトレーニングセットでモデルは低い精度を示す。
Цитаты
"Models seem to capture sequence length as a classification spurious feature."
"The more the distributions overlap, the lesser the problem."