核心概念
大規模言語モデル(LLM)は、人間の脳の言語ネットワークと同様に、言語処理に特化したユニット群を有しており、これらのユニットはLLMの言語能力に不可欠な役割を果たしている。
AlKhamissi, B., Tuckute, G., Bosselut, A., & Schrimpf, M. (2024). The LLM Language Network: A Neuroscientific Approach for Identifying Causally Task-Relevant Units. arXiv preprint arXiv:2411.02280.
本研究は、大規模言語モデル(LLM)が人間の脳のように機能的に特化した領域を持っているのか、特に言語処理に特化したユニット群が存在するのかを調査することを目的とする。