The author proposes CustomListener, a user-friendly framework for generating listener head motions guided by text priors. The approach involves dynamic portrait tokens and past-guided motion generation to achieve controllable and interactive responses.
自由なコントロール可能なリスナーヘッド生成を実現するためのCustomListenerフレームワークが提案されました。