核心概念
本文綜述了計算論證與機器學習交叉領域的研究,探討了論證如何增進機器學習模型效能和可解釋性,以及機器學習如何支持和分析論證過程。
本文綜述了計算論證與機器學習交叉領域的研究。研究發現,這兩個領域的互動存在兩個主要目的:將論證應用於機器學習,以及將機器學習應用於論證。本文系統地評估了這兩個主題下各種研究的多個維度,包括學習類型和所使用的論證框架形式。此外,本文還確定了這兩個領域之間的三種互動類型:協同方法,其中論證和機器學習組件緊密結合;分段方法,其中兩者交錯,一個的輸出作為另一個的輸入;以及近似方法,其中一個組件在選定的細節級別上模擬另一個組件。本文總結了某些形式的論證對支持某些類型的機器學習的適用性,反之亦然,並從綜述中得出了清晰的模式。雖然綜述的研究為成功結合這兩個研究領域提供了靈感,但本文也指出並討論了為確保它們隨著人工智能的進步而保持卓有成效的配對關係而應解決的局限性和挑戰。
本章概述了結合計算論證(以下簡稱論證)和機器學習(ML)的研究工作。在本節中,我們首先概述本章中概述的各個作品中普遍存在的主题和趨勢,包括對機器學習和論證模型之間三種類型互動的粗略分類,然後簡要介紹我們選擇省略的相關工作和論文。然後,我們在第 2 節繼續進行文獻綜述,我們根據機器學習和論證之間互動目的的廣泛主題對其進行劃分,並簡要討論有希望的研究途徑。最後,我們在第 3 節中得出結論。
我們假設讀者熟悉論證的形式和框架,例如在《形式論證手冊》第一卷中討論的那些 (Baroni et al., 2018),以及機器學習的基本原理和常用方法,例如在維基百科上很容易找到。
1.1 展望
考慮論證和機器學習互動的研究呈現出以下趨勢。從機器學習的特徵開始,採用的學習類型主要是監督學習,儘管也有一些研究考慮了無監督以及無監督/監督類型的學習,並且有相當多的研究側重於強化學習 (RL)。在採用的機器學習模型和算法方面,通常(但並非總是)使用更簡單的技術和架構,例如規則學習(包括規則歸納和規則提取)、基於樹的模型(例如決策樹 (DT) 和隨機森林 (RF))、樸素貝葉斯分類器 (NBC)、支持向量機 (SVM)、(通常是淺層和/或前饋)神經網絡 (NN) 和基於模型的強化學習。然而,最近的一些研究選擇了現代複雜模型,特別是圖神經網絡 (GNN),這些模型通常是現成的。實驗中使用的數據通常是表格類型的,儘管文本和圖像數據也有其標記,而在強化學習的情況下,簡單環境中的模擬很突出。數據集本身在很大程度上是基本的和小型的,通常來自 UCI 機器學習存儲庫。 儘管如此,最近採用 GNN 的研究通常使用國際論證計算模型競賽 (ICCMA) 提供的論證圖數據集。
在論證框架方面,我們看到了從抽象到結構化的多樣性。值得注意的是,重點關注抽象論證框架 (AF)、基於價值的論證框架 (VAF) 和(定量)雙極論證框架 ((Q)BAF),其中 QBAF 與神經網絡的結合尤為突出。許多研究使用結構化論證 (SA),包括經典的形式主義,例如可廢止邏輯編程 (DeLP) 和基於假設的論證 (ABA),但更突出的是特定的基於規則的論證框架 (RB),通常使用規則學習構建。一些概率論證 (PA) 和非正式論證的形式也出現了。在語義方面,在綜述的研究中,最流行的似乎是經典的基於基礎或首選擴展的語義,無論是在擴展方面還是在懷疑和輕信可接受性方面,但漸進語義也經常被使用,對話也是一種論證互動和推理的形式。我們將在第 2 節中詳細闡述各個研究的此類論證和機器學習目標特徵。
除了機器學習或論證特徵的趨勢之外,我們還區分了機器學習和論證之間的三種類型互動。首先,機器學習模型和論證模型的協同組合本質上意味著將這兩種模型緊密集成或合併為一個模型。第二種是分段方法,其中機器學習和論證在執行學習和推理時交錯進行,將一個的輸出用作另一個的輸入。最後,第三種類型的互動是近似的,因為一種类型的模型旨在在不同的細節級別上近似或模擬另一種模型。我們認識到這些概念之間的界限並不清晰,我們的目標也不是對互動進行精確定義。相反,我們將這些概念作為指導概念,以收集每個研究中論證和機器學習之間的粗略互動模式,並希望稍後在第 2 節中給出的單獨描述將闡明這三個概念。
論證和機器學習之間互動目的的兩個廣泛主題出現了。我們確定的第一個主題是使用論證來改進和/或解釋機器學習模型。我們在第 2.1 節中概述了遵循這一主題的研究工作。另一個主題是使用機器學習來支持、分析或替換論證。我們在第 2.2 節中概述了此類主題的研究。
至於通過論證改進和/或解釋機器學習,我們確定了以下主題。建議使用結構化論證來改進基於機器學習的分類,通常通過使用規則學習(通常通過分段或協同方法)構建基於規則/前提-結論類型的論證。這可以通過規則或偏好將知識注入基於機器學習的系統來實現,而論證可以實現這一點。論證還可以改進多智能體系統中基於強化學習的策略,通常通過論證選擇動作來實現。此外,論證通常旨在解釋基於機器學習的系統,據稱是因為論證關係(特別是在協同和分段方法中)特別具有分析性和可解釋性。例如,這可以通過在分段或協同方法中對從數據中學習到的規則進行論證推理來實現,或者通過在近似機器學習模型後論證地解釋為什麼一種分類決策優於另一種分類決策來實現。通過展示智能體動作之間的論證互動,或者通過使用論證圖作為學習結構並隨後通過現有的論證可解釋性方法進行解釋,也可以通過論證來增強強化學習中的可解釋性(參見最近的綜述 (Cyras et al., 2021; Vassiliades et al., 2021; Guo et al., 2023))。應該指出的是,(Longo, 2016) 中預見的一些通過論證改進機器學習模型的機會確實已經在某些情況下實現了,特別是那些與將論證知識注入機器學習模型並從而指導推理相關的機會。
至於機器學習支持論證,出現了幾個主要主題。一個是使用機器學習來生成論證框架。這可以通過規則學習來實現,特別是使用歸納機器學習,僅僅是為了以分段的方式構建基於規則的論證框架以進行推理。(這與相反方向的互動主題相呼應,即論證用於改進機器學習模型,如上所述,即使研究的內在目標不同。)同時,抽象類型的框架,特別是抽象論證框架,可以從其他類型的數據或從抽象論證框架本身中學習,通常使用分段方法。另一方面,機器學習模型可以用於計算論證框架的任務,這意味著要預測論證的可接受性狀態,這在很大程度上是在抽象論證框架中使用圖神經網絡以近似的方式進行的。最近的另一個主題是調查某些形式的機器學習,特別是神經網絡,是否可以被視為論證框架,特別是定量雙極論證框架,反之亦然,目的是推進甚至替換此類論證框架,以及分析或推進此類機器學習模型。最後,我們遇到了一些研究日常生活中論證的研究,並調查了機器學習是否可以幫助推薦在現實世界的論證討論中提出的論證,或者是否應該使用機器學習來代替形式論證,因為形式論證在建模這些情況方面存在問題。
到第 2 節結束時,我們將看到許多研究,其中各種形式的論證和機器學習模型以不同的方式互動,以實現單向或相互的利益。我們將看到所提出的系統所解決的不同應用領域(例如醫學、機器人、預測、法律和常識推理)和各種任務(例如分類、策略學習、論證圖生成和計算)。我們將認為一些研究途徑更有希望,通常是由於使用了現代機器學習和更廣泛的實驗,而另一些研究途徑則由於設置過於簡單和/或經驗評估而不太有希望。
對於論證在滿足機器學習方面的一個普遍批評是,顯然缺乏實現(與現成的機器學習模型的豐富形成鮮明對比),這使得兩者之間的互動更加困難。缺乏支持論證假定好處的用戶研究是論證和機器學習配對的另一個關鍵差距。這些擔憂從我們的文獻綜述中可以看出,我們認為如果要使這項跨學科研究取得成果,就應該解決這些擔憂。
在深入討論單個研究之前,我們簡要介紹一下相關工作,以及本章範圍之外的省略工作。
1.2 相關工作和省略
我們將首先討論與我們提供的文獻綜述密切相關的其他論證文獻綜述。目標與我們最接近的研究是 Cocarascu 和 Toni (2016) 的研究,其中作者全面概述了論證對機器學習的支持。作者在這裡指出,當時這個研究領域相對年輕,這確實激勵了我們在機器學習(無論是總體上還是與論證相結合)取得多年快速進步之後做出貢獻的必要性。我們認為確實取得了重大進展的一個方向是使用論證來支持可解釋的人工智能(關於機器學習模型或其他方面),這促使 Vassiliades 等人 (2021)、Cyras 等人 (2021) 和 Guo 等人 (2023) 最近對該文獻進行了三項調查。應該指出的是,論證與機器學習或可解釋的人工智能之間的交叉融合具有一定程度的重疊,但兩者都不包含彼此。最後,Proietti 和 Toni (2023) 給出了神經論證學習的路線圖,即從數據中學習論證框架,重點關注神經符號方法,展望未來工作方向和仍然存在的挑戰。
關於我們認為對我們的綜述來說是多餘的研究,最大和最相關的此類研究主體是關於論證挖掘的,我們建議讀者參考關於論證挖掘的章節,以全面了解這些研究。我們還省略了考慮與自然語言處理或生成相關的任務的論文,例如關於使用論證進行分析 (Hinton 和 Wagemans, 2023; Rajasekharan 等人, 2023) 或微調 (Thorburn 和 Kruger, 2022; Furman 等人, 2023) 大型語言模型 (Brown 等人, 2020) 的研究。此外,雖然論證框架可以被視為特定形式的知識圖譜,但我們認為機器學習和知識圖譜之間的廣泛交叉融合(例如,參見 (Tiddi 和 Schlobach, 2022) 了解最近的綜述)超出了本章的範圍。我們還選擇省略一些研究,例如 (Longo, 2016; Zeng 等人, 2018),其中機器學習僅僅是非正式地被提議作為論證方法的應用,而沒有具體的機器學習應用。此外,考慮通常與機器學習方法相關的任務但不使用任何明確的機器學習的方法,例如 (Amgoud 和 Serrurier, 2008; Potyka 等人, 2022b),或者將機器學習模型視為可能的知識來源的方法,例如 (Hung 等人, 2022),也被省略了。類似地,我們還選擇省略從數據中生成論證圖但不包含任何明確的機器學習技術的方法,例如 (Hunter, 2020)。相反,我們不包括針對典型機器學習任務並且可以被視為具有論證風格但不以任何方式使用論證的方法,例如 (Taniar 等人, 2008)。最後,考慮通常在機器學習中採用的技術的論證方法,例如馬爾可夫決策過程 (MDP),例如 (Potyka, 2020),或貝葉斯網絡 (BN),例如 (Bex 和 Renooij, 2016),但沒有明確使用機器學習本身,通常超出了本章的範圍。