מושגי ליבה
다양한 특징 상호 작용 브랜치를 효과적으로 결합하고 협력 학습 전략을 통해 모델의 성능을 향상시키는 새로운 CTR 예측 모델, MBCnet을 소개합니다.
תקציר
MBCnet: 멀티 브랜치 협력 네트워크를 통한 대규모 클릭률 예측 향상
본 연구 논문에서는 타오바오의 이미지 검색 기반 상품 추천 서비스에서 대규모 클릭률(CTR) 예측을 향상시키기 위해 고안된 새로운 멀티 브랜치 협력 네트워크(MBCnet)를 소개합니다.
기존 CTR 예측 모델의 한계
기존 CTR 예측 모델들은 특징 상호 작용을 모델링하는 데 다양한 기술을 적용해왔지만, 대규모 데이터에서 복잡한 사용자-아이템 관계를 완벽하게 포착하기에는 한계를 보였습니다. 특히, 단일 특징 상호 작용 기술에 의존하는 경우 모델의 성능이 제한될 수 있습니다.
MBCnet의 구조 및 작동 방식
MBCnet는 세 가지 주요 특징 상호 작용 브랜치, 즉 EFGC, Low Rank Cross Net, Deep Net으로 구성됩니다.
- EFGC (Expert-based Feature Grouping and Crossing): 도메인 전문가의 지식을 활용하여 특정 특징 그룹 간의 상호 작용을 학습하고 모델의 기억력을 향상시킵니다.
- Low Rank Cross Net: 저랭크 공간에서 특징 상호 작용을 매핑하여 효율적이고 명시적인 특징 교차를 학습합니다.
- Deep Net: 여러 층의 비선형 MLP를 통해 암묵적인 특징 상호 작용을 학습합니다.
각 브랜치는 서로 다른 강점을 가지고 있으며, 협력 학습을 통해 서로 보완하고 전체적인 학습 능력을 향상시킵니다. 협력 학습은 두 가지 원칙을 기반으로 합니다.
- Branch Co-teaching: 학습이 잘 된 브랜치가 학습이 부족한 브랜치를 특정 샘플에 대해 지도하여 성능을 향상시킵니다.
- Moderate Differentiation: 브랜치 간의 차이를 적절한 수준으로 유지하여 다양한 특징 상호 작용 패턴을 학습하도록 합니다.
실험 결과 및 평가
대규모 산업 데이터셋을 사용한 실험 결과, MBCnet는 기존 CTR 예측 모델보다 우수한 성능을 보였습니다. 특히, 타오바오 앱의 이미지 검색 기반 상품 추천 서비스에 대한 A/B 테스트 결과, CTR이 0.09 포인트 증가하고 거래량은 1.49%, GMV는 1.62% 증가하는 등 유의미한 개선을 달성했습니다.
결론 및 향후 연구 방향
본 연구는 대규모 CTR 예측에서 멀티 브랜치 협력의 효과를 입증했습니다. 향후 연구에서는 더욱 다양한 특징 상호 작용 브랜치를 MBCnet에 통합하고, 협력 학습 전략을 개선하여 모델의 성능을 더욱 향상시킬 수 있을 것으로 기대됩니다.
סטטיסטיקה
타오바오 이미지 검색 데이터는 2023년 6월 1일부터 2024년 5월 31일까지 12개월, 2022년 6월 1일부터 2024년 5월 31일까지 24개월 동안 수집되었습니다.
Pailitao-12month 데이터셋은 4억 8천만 명의 사용자와 9억 7천만 개의 상품, 2,039억 개의 샘플로 구성됩니다.
Pailitao-24month 데이터셋은 5억 2천만 명의 사용자와 13억 개의 상품, 3,959억 개의 샘플로 구성됩니다.
MBCnet는 A/B 테스트에서 기존 모델 대비 CTR 0.09 포인트 증가, 거래량 1.49% 증가, GMV 1.62% 증가를 달성했습니다.
ציטוטים
"Each feature interaction technique brings its own advantages, and solely depending on one type may hinder the model’s potential to capture complex feature relationships."
"MBCnet has been deployed in image2product retrieval at Taobao app, and achieved obvious improvements."