Core Concepts
大規模言語モデル(LLMs)を活用したマルチターン対話システムの最近の進歩に焦点を当てた包括的な調査。
Abstract
この調査は、既存のLLMsとそれらを下流タスクに適応させる方法について包括的な解説を提供し、最新のマルチターン対話システム、データセット、評価指標について詳細に述べています。また、将来の重点や研究上の問題にも触れています。従来の対話システムから深層学習手法を経て、多くのマルチターン対話システムが提案されました。特に事前学習LLMsの登場により、これらの性能が大幅に向上しています。
Stats
LLMsは数十億パラメータを持つ広範な人工知能モデルである。
GPT-3.5はInstructGPTとしても知られ、コードデータでトレーニングされたことで推論速度が向上した。
LLaMAは7Bから65Bパラメータまでの基本言語モデルコレクションであり、GPT-3よりも多くのベンチマークで優れた性能を示す。
Quotes
"Multi-turn dialogue systems can be divided into TOD systems and ODD systems."
"The performance of multi-turn dialogue systems is significantly enhanced by the emergence of pre-trained LLMs."
"Adapters have emerged as an innovative approach within the domain of Parameter-Efficient Fine-Tuning."