本論文は、大規模言語モデル(LLM)の出力が意味的に使用されているかどうかという問題について検討している。
まず、LLMの構築と理論的背景について概説する。LLMは、分散意味論に基づいて構築されており、単語の分布パターンを学習することで単語の意味を表現するベクトル空間を構築する。特に、トランスフォーマー・アーキテクチャを用いることで、文脈に応じて単語の意味を動的に変化させることができる。
次に、LLMの出力が意味的に使用されているかどうかを判断するために、心的メタ意味論と言語メタ意味論の2つのアプローチを検討する。心的メタ意味論は、LLMが心的な意図性の条件を満たすかどうかを問うものだが、LLMはこの条件を満たさない可能性が高い。一方、言語メタ意味論は、LLMの出力が言語的な意味使用の条件を満たすかどうかを問うものである。
最後に、エヴァンスのネーミング実践理論とミリカンの言語的テレオセマンティクス理論を適用することで、LLMの出力は言語的な意味使用として扱うことができると論じる。これらの理論は、言語的な意味性は事前に存在する言語システムに依存するという点で共通しており、LLMはこの言語システムを利用して意味的な出力を生成することができる。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Jumbly Grind... في arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09576.pdfاستفسارات أعمق