Core Concepts
文脈依存学習は意味解析に有効だが、ドメイン固有言語の学習が難しく、性能が限定的。一般的なプログラミング言語を使い、ドメイン記述を加えることで、大幅な性能向上が可能。
Abstract
本研究では、文脈依存学習(ICL)を用いた意味解析の性能向上を目指す。
ICLは少数の例示から学習できるため有効だが、ドメイン固有言語(DSL)の学習が難しく、性能が限定的。
そこで以下の2つの改善策を提案する:
DSLではなく一般的なプログラミング言語(PL)を使う
ドメイン記述(DD)を加える
PLを使うことで、言語モデルの既存の言語知識を活用できる。DDを加えることで、利用可能な演算子やデータ構造などの情報を提供できる。
実験の結果、この2つの改善策を組み合わせることで、大幅な性能向上が得られた。例えば、SMCalFlowデータセットの複合的な分割で、7.9%から66.5%まで改善した。また、複合的な一般化も大幅に向上し、i.i.dデータとの差が小さくなった。
さらに、プログラミング言語の頻度がパフォーマンスを決めるわけではないことも示された。Scalaなどの希少言語でも、適切なDDを使えば、Pythonと同等の性能が得られた。
以上より、文脈依存学習を用いた意味解析では、プログラミング言語とドメイン記述を活用することが有効であることが示された。
Stats
プログラムの長さの平均は、GeoQueryでは49.4文字、Overnightでは282.0文字、SMCalFlowでは372.6文字。
プログラムの最大深さの平均は、GeoQueryでは4.8、Overnightでは6.8、SMCalFlowでは8.7。