核心概念
本研究では、アラビア語文字の想像音声認識のためのEEGデータセットArEEG_Charsを作成し、深層学習モデルを用いた分類実験を行った。最高精度97%を達成した。
要約
本研究の目的は、アラビア語文字の想像音声認識のためのEEGデータセットArEEG_Charsを作成し、深層学習モデルを用いた分類実験を行うことである。
データ収集:
30名の参加者(年齢15-62歳)からEEG信号を収集
各参加者に31個のアラビア語文字を10秒間提示し、10秒間想像させる
合計930個のEEG記録を収集し、250msに分割して39,857個の信号を分析
前処理:
移動平均フィルタを用いてノイズを除去
特徴抽出:
離散ウェーブレット変換(DWT)
統計的特徴量(標準偏差、二乗平均平方根、合計値、エネルギー)
深層学習モデル:
CNN、LSTM、CNN-LSTMを比較
LSTMモデルが最高精度97%を達成
本研究は、アラビア語文字の想像音声認識のための初めてのEEGデータセットを提供し、深層学習モデルによる高精度の分類を実現した。今後は、データセットの拡充や、より短い想像時間での分類精度向上などに取り組む予定である。
統計
標準偏差は、信号の変動を推定する上で効果的であることが証明されている。
二乗平均平方根(RMS)は、各電極に固有の特徴ベクトルであり、一定の区間内の二乗平均平方根の平方根として定義される。
合計値(SUM)は、信号の全ての値を加算したものである。
エネルギー(E)は、離散時間信号xの二乗和として定義される。