Core Concepts
LUCID introduces a highly automated system for generating diverse and challenging dialogue data using Large Language Models (LLMs).
Stats
가상 비서는 transformer 기반의 대형 언어 모델(Large Language Models, LLMs)로 발전하고 있습니다.
기존 데이터셋은 다양한 대화 현상이 부족합니다.
LUCID는 자동화된 데이터 생성으로 데이터 부족 문제를 극복하려 합니다.
LUCID는 100개 의도를 포함한 4,277개의 대화를 생성하는 시드 데이터셋을 생성합니다.
Quotes
"We aim to overcome these issues with LUCID, a modularised and highly automated LLM-driven data generation system that produces realistic, diverse and challenging dialogues."
"To showcase the quality, realism and sophistication of the data generated by LUCID, we release a seed dataset of 92,699 turns."