核心概念
本研究提出了一種名為歸納式 N 元語法模型 (Induction-Gram) 的新型語言模型,透過結合傳統 N 元語法模型和模擬預訓練模型中「歸納頭」機制的全新設計,實現了兼具高效性與可解釋性的語言建模方法。
Kim, E., Mantena, S., Yang, W., Singh, C., Yoon, S., & Gao, J. (2024). Interpretable Language Modeling via Induction-head Ngram Models. arXiv preprint arXiv:2411.00066.
本研究旨在開發一種可解釋且高效的語言模型,以解決現有大型語言模型 (LLM) 在可解釋性和計算效率方面的局限性。