本論文は、アメリカ手話(ASL)を用いたSTEM教育リソースの不足という課題に取り組むため、大規模なデータセット「ASL STEM Wiki」を構築したことを報告している。
聴覚障害者にとって、STEM分野における教育リソースの不足は深刻な問題である。ASLは比較的歴史の浅い言語であり、STEM分野で使用される専門用語の多くに統一された手話が存在しない。そのため、通訳者は fingerspelling を多用せざるを得ず、これは聴覚障害者の学習を阻害する要因となっている。
ASL STEM Wikiは、37名の認定ASL通訳者によって解釈された、254のSTEM関連Wikipedia記事から構成されている。データセットには、300時間以上のASLビデオと、それに対応する英語のテキストが含まれている。これは、STEMコンテンツに焦点を当てた初めての連続手話データセットであり、新しいAIモデリングの課題を提示するものである。
論文では、ASL STEM Wikiを用いて、fingerspelling の検出とアラインメントを行うためのベースラインモデルを提案している。fingerspelling は、ASLにおいて頻繁に使用されるものの、聴覚障害者の学習を困難にする可能性があるため、その検出は重要な課題である。提案されたモデルは、fingerspelling の検出においてランダムベースラインよりも高いIOUスコアを達成しており、ASL STEM Wikiが fingerspelling 検出モデルのトレーニングに有効であることを示している。
ASL STEM Wikiは、手話言語処理の研究を大きく前進させる可能性を秘めている。fingerspelling 検出に加えて、翻訳、サインバリエーションの分析、サインリンキングなど、様々な応用が考えられる。
本データセットは、英語からASLへの解釈に基づいて構築されているため、自然なASLとは異なる可能性がある。また、fingerspelling の使用頻度が高いため、生成的なASLモデルのトレーニングには適さない可能性がある。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問