在多代理強化學習的平均場博弈框架中,引入網路化通訊可以顯著提升去中心化代理的學習效率和系統穩健性,尤其是在沒有預言機且代理只能從單次非片段式經驗系統運行中學習的情況下。
CAMIL 是一種新穎的上下文感知多實例學習架構,通過整合鄰域約束注意力機制,有效利用組織病理學圖像中腫瘤和鄰近細胞的上下文信息,提高了癌症檢測和分型的準確性。
本文提出了一種稱為「人工重播」的元算法,可以有效利用歷史數據來提升多臂老虎機算法的性能,並減少計算和存儲成本。
本文提出兩種基於主基架構和線上鏡像下降方法的演算法,用於解決在未知切換次數 S 的情況下,針對任意策略的對抗性老虎機問題,並分析其性能。
本文探討了在具有雜訊和缺失值的特徵下,情境線性賭博機問題的貝葉斯預測器策略,並提出了一種演算法,在arm數量較多的情況下,可以達到 ˜O(d√T) 的遺憾界限。
預訓練模型的特徵空間,而非僅僅是數據集的相似性,才是決定遷移學習成敗的關鍵因素。
等變模型,特別是那些基於張量積和球諧函數的模型,在分子系統的模擬和預測方面展現了強大的能力。然而,本研究發現,這些模型在訓練過程中可能會忽略某些不可約表示,特別是那些與向量和張量量相關的表示,這可能導致模型效能不佳。
本文提出了一種基於正交耦合動力學 (OCD) 的新型框架來解決 Monge-Kantorovich 問題,並探討了其在計算最優傳輸映射和 Wasserstein 距離方面的應用。
將變分不等式 (VI) 優化方法整合到多代理強化學習 (MARL) 演算法中,可以顯著提高效能和訓練穩定性。
本文提出了一種新的正交非負矩陣分解(ONMF)模型和演算法,採用 Kullback-Leibler(KL)散度作為度量標準,相較於基於 Frobenius 範數的 ONMF,KL-ONMF 更適用於處理文件數據集和高光譜影像等泊松分佈數據,並在文件分類和高光譜影像解混方面展現出更優異的性能。