이 글은 Agoda에서 약 50,000개의 공급업체 및 고객 이메일을 매일 처리하는 과정에서 직면한 과제와 해결책을 다룹니다.
주요 내용은 다음과 같습니다:
GPT 모델 미세 조정을 위한 데이터셋 준비의 어려움: 대량의 이메일을 수집하고 레이블링하는 작업이 시간 소모적이며 많은 인력이 필요함.
코사인 유사도를 활용한 해결책 개발:
실험 결과:
결론:
To Another Language
from source content
medium.com
Önemli Bilgiler Şuradan Elde Edildi
by Agoda Engine... : medium.com 05-07-2024
https://medium.com/agoda-engineering/how-we-leverage-cosine-similarity-for-fine-tuning-dataset-estimation-bba361703365Daha Derin Sorular