這篇研究論文探討了貝氏預測方法在統計學中的應用,重點關注「預測建模」。作者主張,與側重於參數推論的傳統「推論方法」不同,預測建模直接關注可觀察量和預測,並基於其對預測的影響來評估模型和先驗分佈,甚至可以從預測規則中推導出模型和參數。
貝氏統計學的核心在於處理不確定性或不完整資訊。在貝氏統計中,預測透過給定可用資訊的未來觀察值的預測分佈來表達。貝氏預測分佈的關鍵在於它是一種學習規則,透過條件機率形式化我們如何根據可用資訊學習未來事件。
在隨機抽樣的情況下,貝氏方法不假設獨立性,因為這意味著沒有學習。相反,它引入了聯合機率來表達依賴性,反映出每個觀察值都攜帶了關於其他觀察值的資訊。在隨機抽樣中,自然的評估是觀察值的順序不應攜帶任何資訊,即觀察值是可交換的。
雖然在實務上通常透過模型和參數來指定聯合分佈,並如公式 (1.1) 所示計算預測分佈,但原則上可以直接指定預測分佈,特別是在關注預測的情況下。這種預測方法,稱為「預測建模」,直接對可觀察量進行推理,例如可交換性情況下的對稱性,以及樣本中與預測相關的資訊,或預測學習規則的期望屬性。
預測建模可以被視為一種「沒有先驗的貝氏學習」形式。雖然在純粹的預測方法中不需要推論模型,但表示定理提供了從預測到推論的重要連結。de Finetti 的表示定理在貝氏統計中佔據核心地位,它將機率表達在可觀察事件的基礎與推論聯繫起來。
對於可交換序列,預測分佈的極限與經驗分佈的極限一致,這確保了預測與頻率的一致性。此外,對於可交換序列,統計模型是預測分佈的極限,也是經驗分佈的極限。因此,在有限樣本量下,模型的不確定性就是對其共同極限的不確定性,這透過 ˜F 的後驗分佈來表達。
雖然預測建模在概念上是合理的,但在實務中可能難以應用。本節的目的是追溯一些可用的方法,並提供一些例子。這些方法包括預測充分性的概念,它將預測建模與參數模型相協調;以及充分性的不同概念,它通常導致非參數建構;以及基於隨機過程和增強學習的預測建構。
儘管上述討論表明預測方法在理論上是合理的,並且預測建模可以應用於許多情況,但作者承認,僅透過預測建構進行操作可能並不容易,特別是如果希望滿足可交換性約束。然而,資料科學中的許多預測演算法缺乏清晰的不確定性量化,或者在經濟學等領域,主觀預測隱含地受到代理人對現象的解釋的指導,而揭示這些解釋將會很有趣。貝氏預測方法可以有效地應用於這些情況。
總之,本文回顧了貝氏預測方法的基礎和方法,重點關注可交換性及其在預測建模中的作用。作者強調了預測建模的優勢,特別是在處理複雜資料結構和為預測演算法提供不確定性量化方面。
翻譯成其他語言
從原文內容
arxiv.org
深入探究