Core Concepts
Turkish procedural language understanding is crucial for execution and planning, with language-specific models outperforming multilingual ones.
Abstract
プロシージャル言語理解(PLU)は重要であり、トルコ語のチュートリアル数を増やし、タスクに取り組むための高品質なデータを作成するために機械翻訳ツールを活用している。言語固有のモデルが多言語モデルよりも優れており、タスクによっては大きな差があることが示されている。提案されたタスクは、行動のリンク付け、目標推論、手順推論、次のイベント予測、要約などで構成されており、各タスクに対して異なるモデルと手法が使用されている。これらの実験結果は、トルコ語特定のモデルが多言語モデルよりも優れていることを示しており、改善の余地があることを示唆している。
Stats
BLEU: 23.51, ROUGE: 52.25, METEOR: 44.32, COMET: 88.12, chrF: 67.91, chrF++: 62.08
Turkish corpus contains over 52,000 tutorials with around 719K steps and 127K methods.
Human validation results show high average scores with substantial agreement (Fleiss’ Kappa).
Quotes
"Language-specific models consistently outperform their multilingual counterparts by a significant margin across most procedural language understanding tasks."
"We find that our best-performing models for most downstream tasks are still far behind their English counterparts."
"Our experiments reveal that language-specific models tend to outperform multilingual models, but the model size is a critical factor."