VoxHakka는 대만 타이완 하카어의 6개 주요 방언을 지원하는 고품질 다화자 음성 합성 시스템이다. 웹 스크래핑과 자동 음성 인식 기반 데이터 정제 기술을 활용하여 구축된 데이터셋을 바탕으로, 화자 인식 및 제로샷 기능을 갖춘 효율적인 음성 합성 모델을 개발하였다.