Core Concepts
VerAsは、物理実験レポートの自動評価を行う新しいニューラルネットワークアーキテクチャである。レポートの内容を検証し、分析的なルーブリックに基づいて採点を行う。
Abstract
本研究では、物理実験レポートの自動評価を行うVerAsというニューラルネットワークアーキテクチャを提案している。
VerAsは以下の2つのモジュールから構成される:
検証モジュール(verifier)
レポートの各文がルーブリックの各次元に関連しているかどうかを判断する
関連する文を選択して、採点モジュールに渡す
採点モジュール(grader)
検証モジュールが選択した関連文、ルーブリックの次元、およびレポート全体の情報を使って、各次元の採点を行う
順序ロス関数を使うことで、次元の得点を適切に予測できる
実験の結果、VerAsは大学生の物理実験レポートの自動評価において、複数のベースラインモデルを上回る性能を示した。また、中学生の物理エッセイの自動評価においても良好な結果が得られた。
VerAsの検証モジュールは、人間の評価者よりも一貫性が高く、ルーブリックの次元の難易度との関係も明らかにした。一方で、採点モジュールを個別に設定する方が、全体の得点予測よりも優れた結果が得られた。
今後の課題としては、ルーブリックの定義をより適切に取り入れること、および関連文の選択タスクのためのラベル付きデータの不足に対処することが挙げられる。
Stats
物理実験レポートのデータセットでは、平均文長が25.59文(標準偏差12.92)であった。
中学生の物理エッセイのデータセットでは、平均文長が18.69文(標準偏差10.47)であった。