SpeechAlign은 음성 번역 모델의 소스-타겟 정렬 성능을 평가하기 위한 프레임워크이다. 이를 위해 Speech Gold Alignment 데이터셋과 SAER, TW-SAER 평가 지표를 제안한다.