核心概念
전자상거래 마켓플레이스에서 관측 데이터를 활용하여 마켓플레이스의 기대 가치를 추정함으로써 검색 및 추천 시스템의 순위 정책을 학습하는 방법을 제시합니다.
要約
관측 데이터에서 마켓플레이스 기대 가치 추정을 통한 순위 정책 학습: 연구 논문 요약
Bibliographic Information: Ehsan Ebrahimzadeh, Nikhil Monga, Hang Gao, Alex Cozzi, Abraham Bagherjeiran. (2024). Ranking Policy Learning via Marketplace Expected Value Estimation From Observational Data. Proceedings of the ACM SIGIR Workshop on eCommerce (SIGIR eCom’24).
연구 목표: 전자상거래 마켓플레이스에서 관측 데이터를 사용하여 마켓플레이스의 기대 가치를 추정하고, 이를 통해 검색 및 추천 시스템의 순위 정책을 학습하는 것을 목표로 합니다.
방법론:
- 베이지안 결정 프레임워크를 사용하여 사용자 중심적인 관점에서 순위 정책 학습 문제를 공식화합니다.
- 관측 데이터에서 마켓플레이스의 기대 보상에 대한 효과적인 경험적 추정치를 구축하는 주요 요소를 설명합니다.
- 세션 가치 분포, 세션 내 개입의 기여, 관측 데이터의 선택 편향으로 인한 분포 변화를 고려합니다.
- 실험을 통해 다양한 세션 컨텍스트 가치 분포를 비교하여 제안된 프레임워크의 효과를 입증합니다.
주요 결과:
- 사용자 참여 기반 정책은 참여 횟수를 크게 증가시키지만 구매 전환율은 감소시키는 반면, 구매 기반 정책은 그 반대의 결과를 보여줍니다.
- 높은 가격대의 상품을 찾는 사용자 세그먼트에서는 참여 기반 정책이 더 많은 탐색을 유도하여 구매 전환율을 높이는 데 효과적입니다.
- 구매 이벤트에 대한 느슨한 기여 모델은 여러 번의 검색 접점을 포함하는 경향이 있는 높은 가격대 상품 세션에서 일반화 성능을 향상시킵니다.
- 구매 가격을 고려한 가치 기반 정책은 수익 중심 마켓플레이스에서 수익 분포를 효과적으로 변화시켜 높은 가격대 상품의 판매를 증진시킵니다.
주요 결론: 본 연구는 관측 데이터에서 마켓플레이스의 기대 가치를 추정하는 것이 전자상거래 검색 및 추천 시스템의 순위 정책 학습에 효과적임을 보여줍니다. 특히, 세션 컨텍스트 가치 분포를 신중하게 고려하면 마켓플레이스의 특정 목표와 사용자 행동에 맞춰 순위 정책을 최적화할 수 있습니다.
의의: 본 연구는 전자상거래 플랫폼에서 사용자 경험과 비즈니스 목표 사이의 균형을 맞추는 효과적인 순위 정책을 개발하는 데 중요한 시사점을 제공합니다.
제한점 및 향후 연구 방향:
- 본 연구는 단일 제품 의도를 가진 세션에 중점을 두었으며, 다양한 사용자 의도와 다양성 고려 사항을 추가로 고려할 수 있습니다.
- 향후 연구에서는 여러 계층의 프레젠테이션 레이아웃과 다양한 유형의 사용자 상호 작용을 포함하도록 프레임워크를 확장할 수 있습니다.
統計
참여 중심 정책은 클릭이 발생한 세션 비율을 3% 이상 증가시켰습니다.
참여 중심 정책은 구매 이벤트가 발생한 세션 비율을 2% 미만으로 감소시켰습니다.
높은 가격대 상품 세션에서 느슨한 기여 모델을 사용한 정책은 구매 전환율을 최대 4.10%까지 증가시켰습니다.
구매 가격을 고려한 가치 기반 정책은 높은 가격대 상품 세션에서 수익을 최대 1.9%까지 증가시켰습니다.