이 논문은 행정 데이터를 활용한 기계 학습 모델의 성능과 효율성을 높이기 위한 방법을 제안한다. 행정 데이터는 시간 정보를 포함하고 있어 시간 추세를 활용하면 모델 성능을 향상시킬 수 있다. 그러나 모든 데이터 특성에 대해 동일한 시간 창 크기를 적용하면 과도한 복잡성으로 인해 성능이 저하될 수 있다.
이 논문에서는 시계열 분석 기법인 TAIB(Time Series Analysis to Investigate Binning)를 제안한다. TAIB는 각 데이터 특성이 시간 창 크기에 따라 얼마나 변별력이 향상되는지를 분석하여, 시간 창 크기 최적화가 필요한 특성을 선별한다. 이를 통해 모델 복잡도를 낮추면서도 성능을 향상시킬 수 있다.
실험 결과, TAIB를 적용하여 시간 창 크기를 최적화한 모델이 기존 방식보다 더 효율적이고 성능이 우수한 것으로 나타났다. 이는 데이터 특성별 시간 창 크기 최적화가 중요하다는 것을 보여준다. 또한 문제 유형에 따라 시간 창 크기 최적화의 영향이 다르게 나타나므로, 문제 특성을 고려한 접근이 필요하다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor