이 연구는 사용자 피드백 처리 파이프라인에서 사용되는 가중 함수의 최적 가중치 조합을 찾는 것을 목표로 한다. 기존 연구에서는 휴리스틱 방법을 사용해 가중치를 결정했지만, 이 연구에서는 exhaustive search를 통해 최적의 가중치 조합을 찾았다.
실험 결과, 카테고리, 감정, 점수, 길이 등의 표준 특징 대신 엔트로피 특징을 사용하면 NDCG 성능이 향상되는 것을 확인했다. 이는 엔트로피가 다른 특징들을 대체할 수 있음을 보여준다.
또한 가중치 계산 정밀도를 높이면 계산 복잡도가 기하급수적으로 증가하는 한계를 발견했다. 따라서 실용적인 수준에서는 2자리 정밀도가 적절한 것으로 나타났다.
마지막으로 국가 간 편향 문제를 확인하고 이를 완화하는 과정에서 NDCG 성능이 저하되는 trade-off를 발견했다.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы