toplogo
登入

從配對互動中識別部分排序


核心概念
本文探討了在僅觀察到部分配對互動數據,且這些互動並非隨機缺失的情況下,如何有效地推斷對象的排序。
摘要

從配對互動中識別部分排序

edit_icon

客製化摘要

edit_icon

使用 AI 重寫

edit_icon

產生引用格式

translate_icon

翻譯原文

visual_icon

產生心智圖

visit_icon

前往原文

本文研究了基於潛在優劣,並利用配對互動數據對對象進行排序的問題。現有方法依賴於所有互動都被觀察到或隨機缺失的限制性假設。我們探討了在放寬此假設時,可以從排序中推斷出什麼。首先,我們證明在參數模型中(例如流行的 Bradley-Terry-Luce 模型),當且僅當錦標賽圖連通時,排序才能被點識別。其次,我們證明在基於強隨機傳遞性的非參數模型中,連通錦標賽圖中的排序只能被部分識別。最後,我們提出了兩種統計檢驗來確定排序是否屬於識別集。一種檢驗在有限樣本中有效但計算量大,而另一種檢驗易於實施且漸近有效。我們使用巴西雇主-僱員數據說明了我們的程序,以檢驗男性和女性工人在工作轉換時是否對公司有不同的排序。
考慮根據潛在優劣對 𝑞 個對象進行排序的問題。儘管這些優劣是不可觀察的,但對象之間配對互動的數據是可用的。體育比賽就是這種情況的一個例子:參賽隊伍具有潛在的、不可觀察的實力,這些實力會影響比賽的結果。雖然球隊的實力不能直接觀察到,但他們互動的結果(即比賽的獲勝者)是可以觀察到的,這些結果提供了有關球隊相對實力的信息。目標是使用這些數據根據他們的優劣對團隊進行排名。 這個問題不僅限於體育比賽,使用配對互動數據對互動對象進行排序的應用在社會科學中也很普遍,在經濟學中也有幾個例子。工作到工作的工人流動被用來根據員工為其工作的意願對公司進行排名(Sorkin,2018;Corradini 等人,2023;Lagos,2024)。跨期刊引用是一種根據期刊在該領域內的影響力對學術期刊進行排名的方法(Stigler,1994;Palacios-Huerta 和 Volij,2004;Gu 和 Koenker,2022)。在營銷中,聯合分析利用來自調查的配對比較來構建消費者偏好排名並調查驅動這些偏好的因素(Baier 和 Gaul,1998;Čubrić 等人,2019)。這些應用程序依賴於理論模型,這些模型假設所有交互都被觀察到,或者未觀察到的交互是隨機發生的。這些假設在實踐中可能是不現實的,因為觀察到的交互(我們稱之為錦標賽圖)可以包含比在隨機缺失假設下預期更多的連接的節點。 本文摒棄了這些假設,並解決了以下問題:從一般錦標賽結構內的配對交互數據中可以了解到關於真實人口排名的哪些信息?首先,我們證明答案取決於兩個因素:鏈接函數和錦標賽圖的拓撲結構。鏈接函數定義了潛在優劣和配對交互結果之間的關係,而錦標賽圖是一個無向圖,其中頂點代表團隊,邊連接交互的團隊。關於鏈接函數和錦標賽圖結構的假設決定了可以推斷出關於真實排名的哪些信息。其次,我們開發了一個程序來測試特定排名是否與觀察到的配對數據兼容。由於觀察到的結果的真實潛在概率是未知的,因此重要的是要確定觀察到的排名位置的差異是由於樣本不確定性還是反映了潛在優劣的實際差異。 作為第一個貢獻,我們表明,當假設鏈接函數的線性參數形式時,例如在流行的 Bradley-Terry-Luce 模型中(Bradley 和 Terry,1952;Luce,1959),當且僅當錦標賽圖連通時,排名才能被點識別。在連通錦標賽圖中,對觀察到的交互的 DGP 的了解允許對任何一對團隊進行排名,即使它們由遙遠的頂點表示。這一結果是由於以下假設驅動的:每個結果的概率是潛在優劣之間差異的已知函數。雖然我們的結果表明,這一假設提供了強大的識別能力,但我們也證明,即使放鬆線性參數假設,關於排名的信息性推斷仍然是可能的。這為研究人員在沒有明確理由選擇特定參數形式的情況下提供了更大的靈活性。 作為第二個貢獻,我們放寬了對鏈接函數的參數限制,並考慮了一個確保排名存在的非參數模型。我們表明,在這種情況下,對於連通錦標賽,排名只能被部分識別。我們提供了排名識別集的清晰表徵。實現點識別需要更密集的錦標賽圖;具體來說,每個團隊必須要么與其他所有團隊競爭,要么與他們共享一個共同的對手。我們的表徵說明了,通過依賴更可靠的假設,即使在點識別不可行的情況下,配對交互仍然可以產生信息豐富的見解。我們考慮的非參數模型依賴於稱為強隨機傳遞性的假設,並且與 Shah 等人(2016 年)和 Chatterjee 和 Mukherjee(2019 年)中考慮的模型相同。 作為第三個貢獻,我們提出了兩種統計檢驗,用於確定特定排名是否屬於非參數模型的識別集。第一個檢驗對於任何錦標賽圖和任何數量的交互在有限樣本中都是有效的,儘管對於大型錦標賽來說,其實現可能具有計算挑戰性。為了解決這個問題,我們提出了第二個漸近有效且一致的檢驗。後一種檢驗特別適用於在漸近框架內的情況,其中錦標賽中每次交互都有大量的重複可用。 這兩種檢驗都基於似然比檢驗統計量,該統計量比較每次交互中結果概率的受限和不受限估計量。不受限估計量是結果樣本均值的向量,而受限估計量則通過施加矩限制來利用我們對識別集的清晰表徵。直觀地說,如果兩個估計量顯著不同,則表明被檢驗的排名施加了數據不支持的限制,從而導致拒絕排名屬於識別集的原假設。這兩種程序的不同之處在於它們如何計算與檢驗統計量相關的 p 值。第一個檢驗計算最不利分佈的 p 值,這需要解決特定於每個應用的優化問題。第二個檢驗依賴於漸近最不利分佈,這是任何錦標賽都知道的。 為了說明我們的程序,我們將其應用於使用來自 Relaçao Anual de Informacões Sociais (RAIS)(巴西正式部門工作崗位的行政普查)的工作到工作轉變數據來研究公司排名中的性別差異。在 Sorkin(2018 年)和 Corradini 等人(2023 年)工作的基礎上,我們研究了男性和女性工人在做出工作選擇時是否具有不同的偏好。首先,我們按照 Sorkin(2018 年)和 Corradini 等人(2023 年)的做法,應用 PageRank 算法從女性的工作轉變中找到公司的排名。然後,我們測試得到的排名是否屬於應用於男性工作轉變的非參數模型給出的排名識別集。我們的檢驗拒絕了原假設,證實了公司排名中存在性別差異,並證明了如何在對模型的原始假設施加較弱的假設的情況下得出信息豐富的經濟結論。

從以下內容提煉的關鍵洞見

by Federico Cri... arxiv.org 10-25-2024

https://arxiv.org/pdf/2410.18272.pdf
Partially Identified Rankings from Pairwise Interactions

深入探究

如何將該模型擴展到包含可觀察到的協變量,以研究哪些因素會影響排名?

要將模型擴展到包含可觀察到的協變量,可以將團隊的潛在價值建模為可觀察變量和不可觀察變量的函數。具體來說,可以將團隊 ℓ 的潛在價值 𝜃ℓ 建模為: θℓ = 𝛽'𝑋ℓ + 𝜖ℓ, 其中 𝑋ℓ 是與團隊 ℓ 相關的可觀察協變量向量,𝛽 是待估計的參數向量,而 𝜖ℓ 是不可觀察的誤差項。 模型擴展後,可以透過以下方式研究哪些因素會影響排名: 估計參數 𝛽: 可以使用最大似然估計或其他估計方法來估計參數向量 𝛽。𝛽 的估計值可以揭示可觀察協變量對團隊潛在價值的影響程度和方向。 假設檢定: 可以進行假設檢定,以檢驗特定協變量是否對團隊排名有顯著影響。例如,可以使用 Wald 檢定或似然比檢定來檢驗 𝛽 中特定元素是否顯著異於零。 邊際效應分析: 可以計算協變量的邊際效應,以量化協變量變化對團隊排名的影響。例如,可以計算協變量增加一個單位時,團隊預期排名的變化。 這個擴展模型可以應用於以下方面: 勞動經濟學: 可以研究員工特徵(例如教育程度、經驗)和公司特徵(例如規模、產業)如何影響公司排名。 市場營銷: 可以研究產品特徵(例如價格、功能)和消費者特徵(例如年齡、收入)如何影響產品排名。 體育賽事: 可以研究球隊特徵(例如球員平均年齡、預算)和比賽特徵(例如主場優勢、天氣)如何影響球隊排名。 需要注意的是,加入可觀察協變量後,模型的識別條件可能會變得更加複雜。需要根據具體的模型設定和數據情況來確定模型的可識別性和估計方法。

如果放鬆結果獨立性的假設,例如考慮主場優勢,該模型的識別結果將如何變化?

放鬆結果獨立性的假設,例如考慮主場優勢,將會顯著影響模型的識別結果。 主要影響包括: 點識別性的喪失: Theorem 1 的結果不再成立。即使在線性參數模型中,連通圖也不足以保證排名的點識別性。主場優勢會引入額外的參數,使得即使在已知連接函數的情況下,也無法僅從觀測數據中唯一確定團隊的潛在價值。 識別集的擴大: Theorem 2 中的識別集將會擴大。主場優勢會增加模型的彈性,使得更多種排名組合可以與觀測數據相符。 需要額外的假設或數據: 要獲得更精確的排名識別結果,需要引入額外的假設或數據。例如,可以假設主場優勢對所有團隊的影响相同,或者收集有關主場優勢強度的數據。 考慮主場優勢的模型擴展: 可以通過修改模型 (2.1) 來考慮主場優勢: P𝐹,𝜽(𝑌ℓ,𝑘= 1) = 𝐹(𝜃ℓ,𝜃𝑘, 𝐻ℓ,𝑘), 其中 𝐻ℓ,𝑘 是一個二元變量,表示比賽是否在團隊 ℓ 的主場進行。函數 𝐹 現在同時依賴於團隊的潛在價值和主場優勢。 解決主場優勢影響的方法: 固定效應模型: 可以將主場優勢建模為團隊特定的固定效應,並使用面板數據方法來估計模型。 工具變量法: 如果可以找到與主場優勢相關但與團隊潛在價值無關的工具變量,則可以使用工具變量法來解決內生性問題。 控制函數法: 可以嘗試估計主場優勢的影響,並將其作為控制變量加入模型中。 總之,放鬆結果獨立性的假設會使排名識別問題變得更加複雜。需要根據具體的應用場景和數據情況,選擇合適的模型擴展和估計方法。

如何將該模型應用於其他領域,例如推薦系統或在線平台上的產品排名?

該模型可以有效地應用於推薦系統或在線平台上的產品排名,透過分析用戶行為數據來推斷產品的潛在價值和排名。以下是一些具體的應用場景: 1. 推薦系統: 用戶對產品的評分: 可以將用戶對產品的評分(例如,評分、點讚、評論)視為成對比較的结果。例如,如果用戶 A 對產品 ℓ 的評分高於產品 𝑘,則可以將其視為產品 ℓ 在與產品 𝑘 的比較中獲勝。 用戶的瀏覽歷史記錄: 可以根據用戶的瀏覽歷史記錄構建成對比較數據。例如,如果用戶在瀏覽產品 ℓ 後購買了產品 ℓ,而在瀏覽產品 𝑘 後沒有購買,則可以將其視為產品 ℓ 在與產品 𝑘 的比較中獲勝。 2. 在線平台上的產品排名: 電商平台: 可以根據用戶的購買行為、產品評論和評分來推斷產品的排名。例如,可以將兩個產品的銷售量或好評率進行比較,以確定哪個產品更受歡迎。 音樂或視頻流媒體平台: 可以根據用戶的播放列表、收藏夾和收聽/觀看歷史記錄來推斷歌曲或視頻的排名。例如,可以比較兩首歌曲的播放次數或添加到播放列表的次數,以確定哪首歌曲更受欢迎。 社交媒體平台: 可以根據用戶的互動行為(例如,點讚、分享、評論)來推斷帖子或內容的排名。例如,可以比較兩個帖子的點讚數或分享數,以確定哪個帖子更受歡迎。 應用模型時需要注意以下問題: 數據稀疏性: 在推薦系統和在線平台中,用戶與產品的交互數據通常非常稀疏。這意味著許多產品對之間沒有直接的比較數據。可以採用矩陣分解、協同過濾等技術來解決數據稀疏性問題。 冷啟動問題: 對於新用戶或新產品,由於缺乏歷史數據,很難進行準確的排名。可以利用用戶或產品的屬性信息、基於內容的過濾等方法來緩解冷啟動問題。 動態變化: 用戶的偏好和產品的流行度會隨著時間而變化。需要採用動態模型和在線學習算法來捕捉這些變化。 總之,該模型可以有效地應用於推薦系統和在線平台上的產品排名,但需要根據具體的應用場景和數據特點進行適當的調整和擴展。
0
star