本文首先介紹了一個基礎的線上隨機捨入問題:k 單元分配問題。試想一個流動食物銀行每天生產 k 單位的食物,並按照固定順序 1,...,n 拜訪 n 個代理人。食物銀行的目標是最大化每個代理人獲得食物的機率 γ,同時需要滿足公平性約束,即每個代理人獲得食物的機率相同。
對於 k=1 的情況,可以使用一個簡單的隨機化策略來解決這個問題。具體來說,當食物銀行到達代理人 i 時,如果還有剩餘食物,則以 γ/(1 − γ Σ_{j<i} xj) 的機率提供食物給代理人 i,其中 xj 是代理人 j 需要食物的機率。這個策略可以保證每個代理人獲得食物的機率至少為 γ。
然而,公平性約束會導致效率的損失。例如,當 k=1 且 n=2 時,如果兩個代理人需要食物的機率都為 1/2,則最優的公平策略只能保證每個代理人獲得食物的機率為 2/3。而如果食物銀行可以按照不同的順序拜訪代理人,則可以將這個機率提高到 3/4。
這個問題可以推廣到更一般的線上競爭解決方案 (OCRS) 問題。在 OCRS 問題中,代理人按照一定的順序到達,每個代理人以一定的機率處於“活躍”狀態,並且只允許接受一部分代理人。目標是在滿足約束條件的情況下,最大化每個代理人被接受的機率。
本文接著介紹了另一個線上隨機優化問題:序貫招聘問題。一個公司有 k 個職位空缺,需要從 n 個候選人中招聘。每個候選人 i 有一個價值 wi 和接受 offer 的機率 pi。公司可以依次發出 T 個 offer,目標是最大化被錄取的候選人價值總和的期望值。
這個問題可以使用線性規劃 (LP) 放鬆和隨機捨入技術來解決。首先,我們可以將這個問題建模成一個 LP 問題,其中決策變數 yi 表示向候選人 i 發出 offer 的機率。然後,我們可以使用隨機捨入技術將 LP 解轉換成一個可行的招聘策略。
這個方法可以保證招聘策略的效能至少是 LP 最優解的 (1−e−kkk/k!) 倍。特別地,當 k=1 時,這個比例為 1−1/e。
這個結果也說明了隨機捨入技術的一個重要特性:負相關性。在這個問題中,候選人接受 offer 的決策是相互獨立的。然而,由於招聘策略需要滿足職位數量限制,因此被錄取的候選人之間存在負相關性。隨機捨入技術可以有效地利用這種負相關性來提高招聘策略的效能。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询