Core Concepts
비정상적인 주소 문제를 해결하기 위해 검색 증강 대규모 언어 모델(LLM) 기반 주소 재작성 프레임워크인 AddrLLM을 소개하며, 실제 물류 시스템에서 뛰어난 성능과 효율성을 보여줍니다.
Abstract
AddrLLM: 전국 물류 데이터 기반 대규모 언어 모델을 활용한 주소 재작성
본 연구는 배송 오류를 줄이기 위해 비정상적인 주소를 수정하는, 검색 증강 대규모 언어 모델(LLM) 기반 주소 재작성 프레임워크인 AddrLLM을 제안합니다.
AddrLLM은 대규모 언어 모델의 지도 학습 미세 조정, 편향 없는 목표 정렬, 주소 중심 검색 증강 생성의 세 가지 주요 구성 요소로 이루어져 있습니다. 먼저, JD의 LBS 시스템에서 수집한 방대한 양의 고품질 데이터 세트를 사용하여 주소 재작성 작업과 관련된 지도 학습 미세 조정을 수행합니다. 그런 다음, 목표 정렬 모듈을 설계하여 재작성된 주소가 원하는 결과로 보정되도록 합니다. 보상 모델이나 수동 주석으로 인한 잠재적인 편향을 방지하기 위해, 재작성 작업에서 모델의 성능에서 직접 파생된 편향 없는 피드백을 제공하는 LBS 시스템을 통합합니다. 마지막으로 재작성 프로세스를 개선하기 위해 관련 주소를 검색하여 LLM을 문맥 정보로 풍부하게 하는 맞춤형 RAG 모듈을 개발합니다.