Core Concepts
본 연구는 그래디언트 부스팅 트리 기반 확률적 학습 순위 기법을 위한 효율적인 헤시안 행렬 추정 방법을 제안한다.
Abstract
본 연구는 확률적 학습 순위(Stochastic Learning to Rank) 분야에서 그래디언트 부스팅 트리(Gradient Boosted Trees)를 효과적으로 활용할 수 있는 방법을 제안한다.
확률적 학습 순위는 확률적 순위 모델을 최적화하는 새로운 접근법으로, 기존 결정론적 순위 모델과 달리 다양성 증대, 노출 형평성 향상, 탐험-활용 균형 등의 장점을 가진다. 그러나 기존 확률적 학습 순위 방법들은 주로 신경망 모델에 초점을 맞추어왔으며, 그래디언트 부스팅 트리와 같은 강력한 순위 모델은 활용되지 않았다.
이에 본 연구는 그래디언트 부스팅 트리를 확률적 학습 순위에 적용하기 위해 필수적인 헤시안 행렬 추정 방법을 제안한다. 제안된 방법은 기존 PL-Rank 프레임워크와 효과적으로 통합되어, 1차 및 2차 미분을 동시에 계산할 수 있다. 실험 결과, 헤시안 행렬을 고려하지 않은 경우 그래디언트 부스팅 트리의 성능이 매우 저조하지만, 제안된 헤시안 추정 방법을 적용하면 신경망 모델을 능가하는 성능을 달성할 수 있음을 보여준다. 또한 그래디언트 부스팅 트리는 신경망 모델에 비해 수렴 안정성이 높은 것으로 나타났다.
따라서 본 연구는 확률적 학습 순위 분야에서 그래디언트 부스팅 트리의 활용을 가능하게 하는 중요한 기여를 제공한다.
Stats
순위 목적 함수 R(π)의 문서 d에 대한 2차 미분은 다음과 같이 표현된다:
𝜕2/𝜕𝑚(𝑑)2 𝑅(𝜋) = E𝑦[1 - rank(𝑑,𝑦)/∑𝑥=1^rank(𝑑,𝑦) 𝜋(𝑑| 𝑦1:𝑥−1)] * (∑𝑘=rank(𝑑,𝑦)+1^𝐾 𝜃𝑘𝜌𝑦𝑘) + ∑𝑘=1^rank(𝑑,𝑦) 𝜋(𝑑| 𝑦1:𝑘−1) * (𝜃𝑘𝜌𝑑 - ∑𝑥=𝑘^𝐾 𝜃𝑥𝜌𝑦𝑥) * (1[𝑑∈𝑦] + 1 - 𝜋(𝑑| 𝑦1:𝑘−1) - ∑𝑥=1^rank(𝑑,𝑦) 𝜋(𝑑| 𝑦1:𝑥−1))]