核心概念
SignBank+ dataset optimized for machine translation between spoken language text and SignWriting, surpassing original dataset models.
統計資料
モデルのトレーニングに使用されるオリジナルデータよりも、クリーンなデータでの翻訳品質が一貫して向上していることを示す。
クリーンなデータでのBLEUスコアは24.33、chrFスコアは27.88。
拡張されたデータセットでは、性能低下が見られる可能性がある。
引述
"A meticulously curated dataset will enhance the accuracy and reliability of translation models."
"Our best results came from GPT-4, which achieved an IoU of 0.80."