Bias in NLU benchmarks originates from instruction patterns, impacting model performance and generalization.
注釈者が書く例文には、特定のパターンがあり、これが収集されたデータに影響を与える可能性があることを示す。