이 논문은 개별 예측의 신뢰성을 평가하기 위한 데이터 중심 접근법을 제안한다. 기존의 모델 중심 접근법과 달리, 이 방법은 학습 데이터 자체에 초점을 맞춘다.
먼저, 예측 모델의 성능은 학습 데이터에 의해 제한된다는 점에 주목한다. 따라서 특정 예측을 하기에 적합한 데이터셋인지 여부를 판단하는 것이 중요하다.
이를 위해 두 가지 핵심 요소를 고려한다:
이 두 요소를 바탕으로 strongRU와 weakRU라는 두 가지 신뢰성 평가 지표를 정의한다. strongRU는 쿼리 포인트가 데이터에 의해 잘 표현되지 않고 불확실한 영역에 속하는 경우에만 경고 신호를 보낸다. weakRU는 이 두 가지 조건 중 하나라도 만족하면 경고 신호를 보낸다.
이를 위해 k-근접 이웃 기반의 접근법을 제안한다. 데이터셋 자체에서 대표성과 불확실성 요소를 학습하고, 이를 활용하여 효율적이고 확장 가능한 알고리즘을 개발한다. 또한 추론 시 데이터에 접근할 필요 없이 이 값들을 추정할 수 있는 방법도 제안한다.
실험 결과, 제안된 RU 지표가 다양한 데이터셋, 모델, 작업에서 일관되게 모델 성능과 상관관계를 보이는 것을 확인했다. 특히 RU 값이 높은 튜플의 경우 모델이 정확한 예측을 하지 못하는 경향이 있다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問