Core Concepts
ロボットは人間とのスムーズな協調のために、自身の内部状態を効果的に伝達する必要がある。本研究では、強化学習を用いて、ロボットの機能状態(進行中、完了、停止)を非言語の音声表現で伝えるパラメータを最適化する。
Abstract
本研究では、ロボットの機能状態(進行中、完了、停止)を非言語の音声表現で伝えるための学習手法を提案している。
まず、音声表現のパラメータ(BPM、BPL、ピッチベンド)を離散化して音声ライブラリを作成し、これをマルチアームバンディットの行動空間とした。次に、ユーザからのフィードバックを報酬信号として、UCB1アルゴリズムを用いて各状態の最適なパラメータ値を学習する。
ユーザ実験の結果、以下のことが明らかになった:
提案手法により、ユーザがロボットの状態を正確に識別できるようになった。
過去のユーザデータに基づいて初期化することで、学習の収束が大幅に早まった。
初期化の方法によって、ユーザ間で収束したパラメータ値の類似性が異なった。
ピッチベンドのパラメータが、ユーザの状態認識に最も大きな影響を与えた。
Stats
ユーザの状態識別正解率が、学習前に比べて学習後に有意に向上した。