Conceitos essenciais
본 논문에서는 대규모 언어 모델(LLM) 기반 추천 시스템(RS)에서 진화 알고리즘(EA)의 성능을 평가하기 위한 벤치마크 문제 세트인 RSBench를 제안하고, NSGA-II, MOEA/D, IBEA 프레임워크를 기반으로 세 가지 LLM 기반 EA를 개발하여 RSBench 문제 해결 성능을 비교 분석합니다.
Resumo
추천 시스템을 위한 언어 모델 진화 알고리즘: 벤치마크 및 알고리즘 비교
본 연구는 대규모 언어 모델(LLM) 기반 추천 시스템(RS)에서 진화 알고리즘(EA)의 성능을 평가하고, LLM 기반 EA가 RSBench 문제 해결에 어떻게 활용될 수 있는지에 대한 통찰력을 제공하는 것을 목표로 합니다.
RSBench 벤치마크 문제 세트 소개
세션 기반 추천에 중점을 둔 벤치마크 문제 세트인 RSBench를 제안합니다.
RSBench는 추천 정확도, 다양성, 공정성을 균형 있게 고려하여 추천 프로세스를 안내하는 파레토 최적 프롬프트 세트를 찾는 것을 목표로 합니다.
MovieLens-1M, Games, Bundle의 세 가지 실제 데이터 세트를 사용하여 9가지 다목적 인스턴스를 설계했습니다.
LLM 기반 다목적 EA 개발
NSGA-II, MOEA/D, IBEA의 세 가지 대표적인 EA 프레임워크를 기반으로 LLM 기반 EA를 개발했습니다.
LLM 기반 연산을 기존 알고리즘에 통합하여 RSBench 문제 해결을 지원합니다.
실험 및 평가
개발된 세 가지 LLM 기반 EA(LLM-NSGA-II, LLM-MOEA/D, LLM-IBEA)의 성능을 RSBench 문제를 사용하여 실험적으로 평가했습니다.
하이퍼볼륨(HV) 지표를 사용하여 알고리즘의 품질을 측정했습니다.
LLM 기반 초기화 및 LLM 기반 자손 생성의 유효성을 조사했습니다.