이 연구는 대규모 언어 모델(LLM)의 강력한 표현력을 활용하여 맞춤형 의상 추천 시스템을 개발하는 것을 목표로 합니다. 주요 내용은 다음과 같습니다:
멀티모달 언어 모델(MLLM)을 사용하여 패션 이미지에서 스타일과 색상 특성을 추출하여 LLM의 의상 호환성 이해를 향상시킵니다.
매개변수 효율적 미세 조정(PEFT) 기법을 통해 LLM을 효율적으로 미세 조정하여 스타일리시하고 트렌드에 맞는 의상 추천 능력을 향상시킵니다.
직접 선호도 최적화(DPO) 기법을 활용하여 사용자 선호도 피드백을 LLM 학습에 통합함으로써 계속해서 추천 성능을 향상시킵니다.
이 프레임워크는 Polyvore 데이터셋에서 평가되었으며, 두 가지 핵심 작업인 "빈칸 채우기"와 "보완 아이템 검색"에서 기존 LLM 기반 접근법을 크게 능가하는 성능을 보여주었습니다. 이는 제안된 프레임워크가 스타일리시하고 트렌드에 맞는 의상 추천을 생성할 수 있으며, 사용자 피드백을 통해 지속적으로 개선될 수 있음을 시사합니다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Najmeh Forou... a las arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.12150.pdfConsultas más profundas