本研究では、SHADOWと呼ばれる言語モデルを紹介する。SHADOWは、連想推論的推論を使った中間タスクで微調整されたモデルであり、ウィキデータのトリプル補完タスクで評価される。
実験では、5つの関係タイプに対して設計された5つのテンプレートを使用する。SHADOWは、与えられた主語と関係に基づいて正しいテンプレートIDを生成するよう訓練される。これにより、SHADOWは関係タイプと適切なテンプレートの関連付けを暗黙的に学習し、数値値を生成して正しいテンプレートIDを特定することができる。
結果として、SHADOWは全体的に良好なパフォーマンスを示し、ベースラインを20%上回る。ただし、一部の関係タイプでは課題が残る。たとえば、countryLandBordersCountryの関係では再現率が高いものの精度が低い。一方、seriesHasNumberOfEpisodesの関係では精度は高いものの再現率が低い。これは、モデルが特定の関係タイプの知識を十分に学習できていないことを示唆している。
今後の課題としては、関係タイプの詳細な分析を行い、言語モデルの知識を向上させ、推論能力をさらに評価することが挙げられる。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor