Core Concepts
과도하게 매개변수화된 모델은 OOD 입력에 대해 과도하게 자신감을 보이는 경향이 있다. 이를 해결하기 위해 우리는 대상 작업에 관심이 있는 매개변수만 마스킹하여 보정된 하위 네트워크를 찾을 수 있다. 이 하위 네트워크는 IND와 OOD를 더 잘 구분할 수 있다.
Abstract
이 논문은 OOD(Out-of-Domain) 의도 분류에 대한 근본적인 문제를 다룹니다. 대부분의 기존 방법은 광범위한 보조 OOD 코퍼스나 특정 훈련 패러다임에 의존하지만, 모델이 IND와 OOD 의도에 대해 차별화된 자신감을 가져야 한다는 근본 원리가 충분히 개발되지 않았습니다.
이 논문은 과도하게 매개변수화된 모델이 OOD에 대해 과도하게 자신감을 보이는 근본 원인을 밝히고, 대상 작업에 관심이 있는 매개변수만 마스킹하여 보정된 하위 네트워크를 찾을 수 있음을 보여줍니다. 이 보정된 하위 네트워크는 IND와 OOD를 더 잘 구분할 수 있으며, 대부분의 사후 방법에 도움이 될 수 있습니다.
또한 이 논문은 로터리 티켓 가설을 오픈월드 시나리오로 확장합니다. 4개의 실제 데이터셋에 대한 광범위한 실험을 통해 제안 방법이 경쟁 기준선에 비해 일관된 성능 향상을 보여줍니다.
Stats
과도하게 매개변수화된 모델은 OOD 입력에 대해 과도하게 자신감을 보인다.
보정된 하위 네트워크는 IND와 OOD를 더 잘 구분할 수 있다.
온도 조절은 IND와 OOD를 효과적으로 구분할 수 있다.
Quotes
"과도하게 매개변수화된 모델은 OOD 입력에 대해 과도하게 자신감을 보이는 경향이 있다."
"보정된 하위 네트워크는 IND와 OOD를 더 잘 구분할 수 있으며, 대부분의 사후 방법에 도움이 될 수 있다."
"온도 조절은 IND와 OOD를 효과적으로 구분할 수 있다."