核心概念
プロジェクト「MOSLA」は、オンラインによる2年間の第二言語学習の全過程を多様なモダリティで記録し、学習者の言語習得過程の深い洞察と、多様な応用分野への活用を目指す。
要約
プロジェクト「MOSLA」は、第二言語習得(SLA)の複雑で動的な過程を解明するため、参加者に3つの言語(アラビア語、スペイン語、中国語)を2年間オンラインで学習させ、その全過程を記録したデータセットを作成した。
- 縦断的(2年間)、多様相的(ビデオ、スクリーン、音声)、多言語(アラビア語、スペイン語、中国語)のデータを収集
- 人手と機械学習モデルによる発話の分節化、話者・言語識別、自動音声認識の注釈付与
- 注釈データを用いて、学習者の言語使用率や語彙多様性の経時的変化などの言語学的分析を実施
- 映像・音声データから、教師と学習者の画面注視位置を特定する多様相分析も実施
- 収集したデータは研究用に無償公開され、SLA、言語処理、教育工学などの分野で活用が期待される
統計
学習者の目標言語使用率は時間とともに増加する(相関係数0.32-0.73、p<0.01)
学習者と教師のGuiraud指数(語彙多様性指標)も時間とともに増加する(相関係数0.30-0.55、p<0.01)