Core Concepts
Control-DAG는 어휘, 어휘집, 길이 제약 조건을 동시에 제공하여 비자동회귀 텍스트 생성의 주요 한계를 해결한다.
Abstract
이 논문에서는 Control-DAG라는 제약 조건 디코딩 알고리즘을 소개한다. Control-DAG는 Directed Acyclic 모델에 어휘, 어휘집, 길이 제약 조건을 동시에 적용하여 비자동회귀 텍스트 생성의 주요 한계를 해결한다.
먼저, Directed Acyclic 모델인 DA-T5가 생성한 Directed Acyclic Graph(DAG)를 Weighted Finite State Automata(WFSA)로 변환한다. 그 다음, 지정된 개체명을 생성하고 Out-Of-Vocabulary(OOV) 단어를 제거하기 위해 WFSA와 제약 조건 FSA를 교차시킨다. 마지막으로, 목표 길이를 만족하는 가장 가능성 높은 문장을 찾기 위해 DFS-Viterbi 알고리즘을 사용한다.
Control-DAG는 Schema Guided Dialogue와 DART 데이터셋에서 강력한 비자동회귀 성능을 보여준다. DA-T5에 Control-DAG를 적용하면 OOV 오류가 없고 지정된 개체명을 정확하게 생성하며, 두 데이터셋에서 BLEU와 BLEURT 점수가 크게 향상된다. 또한 Control-DAG는 자동회귀 제약 빔 서치 대비 1.7배에서 6.3배 빠른 속도를 보인다.
Stats
입력 길이가 x일 때, 목표 출력 길이는 SGD에서 ⌈26.1x + 0.4⌉, DART에서 ⌈0.5x + 11.9⌉이다.
SGD 데이터셋에서 Control-DAG의 Slot Error Rate(SER)은 0%이고, DART 데이터셋에서 Exact Occurrence Error Rate(EOR)도 0%이다.
Quotes
"Control-DAG는 어휘, 어휘집, 길이 제약 조건을 동시에 제공하여 비자동회귀 텍스트 생성의 주요 한계를 해결한다."
"Control-DAG는 Schema Guided Dialogue와 DART 데이터셋에서 강력한 비자동회귀 성능을 보여준다."