核心概念
本文提出了一種基於套索多項式邏輯迴歸模型的籃球比賽數據分析方法,用於評估球員的進攻和防守貢獻,並引入了一個新的加權評估指標——加權期望得分 (wEPTS),該指標考慮了每個球員的比賽參與度,並在多項式模型的基礎上,根據球員在場上時球隊的得分期望值來評估球員的表現。
文章標題: 基於套索多項式模型的籃球比賽數據表現指標研究
作者: Argyro Damoulaki, Ioannis Ntzoufras, Konstantinos Pelechrinis
期刊: arXiv 預印本
出版年份: 2024
研究目標: 本文旨在研究基於套索多項式邏輯迴歸模型的籃球比賽數據分析方法,以評估球員的進攻和防守貢獻,並提出一個新的加權評估指標——加權期望得分 (wEPTS)。
研究方法: 本文使用 2021-2022 賽季 NBA 比賽的回合數據,首先使用嶺迴歸和套索迴歸對傳統的正態迴歸模型進行了分析,然後使用二元和多項式邏輯迴歸模型對球員的進攻和防守貢獻進行了建模。最後,本文提出了一個基於多項式邏輯迴歸模型的加權期望得分 (wEPTS) 指標,該指標考慮了每個球員的比賽參與度。
主要發現:
與嶺迴歸相比,套索迴歸在處理低上場時間球員的評估方面表現更出色。
多項式邏輯迴歸模型比正態迴歸模型更適合用於籃球比賽數據分析,因為它可以分別對不同類型的得分進行建模。
加權期望得分 (wEPTS) 指標考慮了每個球員的比賽參與度,可以更準確地評估球員的表現。
主要結論: 本文提出的基於套索多項式邏輯迴歸模型的籃球比賽數據分析方法,以及加權期望得分 (wEPTS) 指標,為評估球員的進攻和防守貢獻提供了一種新的、更準確的方法。
研究意義: 本文的研究結果對於籃球教練、球探和數據分析師具有重要的參考價值,可以幫助他們更準確地評估球員的表現,制定更合理的比賽策略和球員引援計劃。
研究局限和未來研究方向: 本文的研究僅基於一個賽季的 NBA 比賽數據,未來可以考慮使用更多賽季的數據進行分析。此外,未來還可以考慮將其他因素,例如球員的位置、年齡、傷病史等納入模型中,以進一步提高模型的準確性和解釋力。
統計資料
數據集包含 2021-2022 賽季 NBA 比賽的 322,852 個回合數據。
59.6% 的回合沒有得分,26.2% 的回合得到兩分,11.6% 的回合得到三分。
低上場時間球員被定義為整個賽季上場時間少於 200 分鐘的球員。
在完整數據集中,有 232 名球員被歸類為低上場時間球員,佔所有球員的 32%。
在過濾掉低上場時間球員後,數據集包含 485 名球員。
嶺迴歸模型的最佳收縮參數 λ 為 241.07。
套索迴歸模型的最佳收縮參數 λ 為 0.27。
多項式邏輯迴歸模型的均方根誤差 (RMSE) 為 1.62,低於正態模型的 1.86。