Core Concepts
대형 언어 모델을 활용하여 여행 관련 온라인 리뷰에서 고객 니즈를 자동으로 추출하고 분석하는 방법을 제시한다.
Abstract
이 연구는 여행 산업에서 고객 니즈 분석을 위해 다양한 대형 언어 모델(LLM)을 비교 분석한다.
연구진은 TripAdvisor 게시물에서 고객 니즈를 수동으로 라벨링하고, 이를 기준으로 LLM의 성능을 평가했다.
평가 지표로 BERTScore, ROUGE, BLEU를 사용했으며, 최적화된 Chain-of-Thought 프롬프팅과 기본 Few-shot 프롬프팅을 비교했다.
연구 결과, GPT-4와 Mistral 7B가 가장 우수한 성능을 보였다. Mistral 7B는 GPT-4와 유사한 수준의 결과를 내면서도 계산 자원 요구량이 낮아 중소기업에 적합할 것으로 나타났다.
이 연구는 여행 산업에서 고객 니즈 분석을 위한 LLM 활용 방안을 제시하며, 기업이 적절한 모델을 선택할 수 있도록 도움을 준다.
Stats
여행 고객 니즈 수동 라벨링 결과, 총 511개의 니즈(387개 고유)가 식별되었으며, 게시물당 평균 1.86개의 니즈가 있었다.
GPT-4 Chain-of-Thought 프롬프팅의 BERTScore F1은 0.683으로 가장 높았다.
Mistral 7B Chain-of-Thought 프롬프팅의 BERTScore F1은 0.632로 두 번째로 높았다.
Quotes
"대형 언어 모델은 고객 경험 관리 분야에서 고객 지원, 제품 추천, 고객 니즈 분석 등에 활용될 수 있는 중요한 자산이 될 것이다."
"오픈소스 모델인 Mistral 7B는 GPT-4와 유사한 성능을 보이면서도 계산 자원 요구량이 낮아 중소기업에 적합할 것으로 판단된다."