핵심 개념
제로 리소스 도메인에서 의도 감지를 위한 데이터 증강 방법을 제안한다. 기존 데이터 증강 방법은 각 의도 범주에 대한 소량의 레이블링된 예제에 의존하지만, 이는 많은 잠재적 의도가 있는 환경에서 비용이 많이 든다. 우리는 두 단계 접근법을 사용한다: 첫째, 제로샷 설정에서 대규모 언어 모델을 사용하여 의도 레이블에 대한 발화를 생성한다. 둘째, 더 작은 시퀀스-투-시퀀스 모델(Refiner)을 개발하여 생성된 발화를 개선한다. Refiner는 기존 도메인에서 미세 조정되고 이후 새로운 도메인에 적용된다. 우리는 생성된 데이터로 의도 분류기를 학습시키고 실제(인간) 데이터에 대해 평가한다. Refiner가 제로샷 LLM 기준선과 일반적인 기준 접근법에 비해 생성된 데이터의 유용성과 다양성을 크게 향상시킨다는 것을 발견했다. 우리의 결과는 제로샷 설정의 생성 LLM과 더 작은 시퀀스-투-시퀀스 모델의 두 단계 접근법이 의도 감지를 위한 고품질 데이터를 제공할 수 있음을 보여준다.
초록
이 논문은 제로 리소스 도메인에서 의도 감지를 위한 데이터 증강 방법을 제안한다. 기존 데이터 증강 방법은 각 의도 범주에 대한 소량의 레이블링된 예제에 의존하지만, 이는 많은 잠재적 의도가 있는 환경에서 비용이 많이 든다.
제안된 방법은 두 단계로 구성된다:
- 제로샷 설정에서 대규모 언어 모델을 사용하여 의도 레이블에 대한 발화를 생성한다.
- 더 작은 시퀀스-투-시퀀스 모델(Refiner)을 개발하여 생성된 발화를 개선한다. Refiner는 기존 도메인에서 미세 조정되고 이후 새로운 도메인에 적용된다.
실험 결과, Refiner가 제로샷 LLM 기준선과 일반적인 기준 접근법에 비해 생성된 데이터의 유용성과 다양성을 크게 향상시킨다는 것을 보여준다. 이는 제로샷 설정의 생성 LLM과 더 작은 시퀀스-투-시퀀스 모델의 두 단계 접근법이 의도 감지를 위한 고품질 데이터를 제공할 수 있음을 시사한다.
통계
사용자 발화를 즉시 차단하고 싶습니다.
계정 활동을 중지하고 싶습니다.
계정을 동결하는 방법을 알려주세요.
인용구
"User: I would like to freeze my bank account temporarily."
"Can you please put a hold on my account for a specific period of time?"
"I need to prevent any transactions on my account for a while."