Keskeiset käsitteet
본 논문에서는 실제 레이블 노이즈를 포함하는 대규모 텍스트 분류 벤치마크 데이터셋인 AlleNoise를 소개하고, 기존의 레이블 노이즈 완화 방법들이 AlleNoise의 실제 노이즈를 효과적으로 처리하지 못한다는 것을 실험적으로 보여줍니다.
Tiivistelmä
AlleNoise: 실제 레이블 노이즈가 있는 대규모 텍스트 분류 벤치마크 데이터셋 (연구 논문 요약)
R ˛aczkowska, A., Osowska-Kurczab, A., Szczerbi´nski, J., Jasinska-Kobus, K., & Nazarko, K. (2024). AlleNoise: large-scale text classification benchmark dataset with real-world label noise. arXiv preprint arXiv:2407.10992v2.
본 연구는 실제 환경에서 발생하는 레이블 노이즈를 포함하는 대규모 텍스트 분류 벤치마크 데이터셋의 필요성에 따라 AlleNoise를 구축하고, 기존 레이블 노이즈 완화 방법들의 성능을 평가하는 것을 목표로 합니다.