本文提出了一個簡單的馬爾可夫決策過程(MDP)模型來描述社交網絡中的用戶分享行為。在這個模型中,用戶可以隨機地選擇分享內容或不分享,分享的概率取決於之前的系統變體和狀態序列。作者導出了一個無偏的估計量來估算分享效果,並通過可重複的合成實驗證明其優於現有方法。
具體來說,作者做出了以下貢獻:
提出了一個簡單的MDP模型來描述社交網絡中的用戶分享行為。在這個模型中,用戶在任意狀態下分享內容的概率僅取決於當前的系統變體,與之前的變體分配無關。
基於這個MDP模型,作者導出了一個無偏的估計量來估算分享效果。這個估計量利用了幾何級數的性質,可以直接計算出策略的價值。
通過可重複的合成實驗,作者展示了所提出的估計量在樣本量較小時能顯著優於現有的方法,如Naïve估計量和Differences-in-Qs估計量。
這些結果表明,適當地利用MDP的結構特性,可以顯著改善一般用途估計量的性能。作者指出,這些結果是初步的,未來還需要探討在MDP假設被違反的情況下的表現。
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы