이 논문은 행정 데이터를 활용한 기계 학습 모델의 성능과 효율성을 높이기 위한 방법을 제안한다. 행정 데이터는 시간 정보를 포함하고 있어 시간 추세를 활용하면 모델 성능을 향상시킬 수 있다. 그러나 모든 데이터 특성에 대해 동일한 시간 창 크기를 적용하면 과도한 복잡성으로 인해 성능이 저하될 수 있다.
이 논문에서는 시계열 분석 기법인 TAIB(Time Series Analysis to Investigate Binning)를 제안한다. TAIB는 각 데이터 특성이 시간 창 크기에 따라 얼마나 변별력이 향상되는지를 분석하여, 시간 창 크기 최적화가 필요한 특성을 선별한다. 이를 통해 모델 복잡도를 낮추면서도 성능을 향상시킬 수 있다.
실험 결과, TAIB를 적용하여 시간 창 크기를 최적화한 모델이 기존 방식보다 더 효율적이고 성능이 우수한 것으로 나타났다. 이는 데이터 특성별 시간 창 크기 최적화가 중요하다는 것을 보여준다. 또한 문제 유형에 따라 시간 창 크기 최적화의 영향이 다르게 나타나므로, 문제 특성을 고려한 접근이 필요하다.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Musa Taib,Ge... lúc arxiv.org 03-14-2024
https://arxiv.org/pdf/2401.16537.pdfYêu cầu sâu hơn