시각 음성 분석은 다양한 응용 분야에서 중요한 역할을 하지만, 현재 기술은 실제 세계 요구 사항을 충족하기에 아직 부족하다. 이 논문은 시각 음성 인식과 생성을 중심으로 심층 학습 기반 방법론을 종합적으로 검토하고, 주요 과제와 미래 연구 방향을 제시한다.