HierTOD 是一個針對企業環境設計的任務導向對話系統,採用階層式目標和混合主動互動來增強對話效率和任務完成度。
本文提出了一種結合監督學習和離線強化學習的方法,利用成功率和 BLEU 評估指標作為獎勵函數, fine-tune 預先訓練好的 GPT-2 語言模型,以構建更有效的多領域任務導向對話系統,並在 MultiWOZ2.1 數據集上取得了顯著的性能提升。
DARD 是一種基於多代理架構的新型任務導向對話系統,透過將任務委派給特定領域的代理,有效提升了對話資訊率和成功率,展現出高度靈活性和可組合性。
本研究提出了一種名為 SyncTOD 的新方法,透過結合上下文學習和特定任務提示,提升了端到端任務導向對話系統在低資源環境下的效能,並在完整資料集上保持了競爭力。