이 논문은 코드 생성을 위한 대규모 언어 모델(LLM4Code)의 비기능적 속성에 대한 체계적인 문헌 조사를 수행한다. 총 146개의 관련 연구를 검토하여 정확도 이외에 강건성, 보안, 프라이버시, 설명 가능성, 효율성 및 사용성의 7가지 중요한 속성을 식별하였다.
강건성: LLM4Code는 입력이 약간 변경되어도 일관되고 올바르게 수행할 수 있어야 한다. 연구에서는 화이트박스 및 블랙박스 평가 방법과 목표 공격 및 비목표 공격을 제안하였다. 또한 적대적 훈련, 마스크 훈련 등의 방법으로 강건성을 향상시킬 수 있다.
보안: LLM4Code는 데이터 중독 공격 및 백도어 공격에 취약할 수 있다. 연구에서는 이러한 공격을 평가하고 탐지하는 방법을 제안하였다. 자동 탐지 방법과 인간 검토 방법이 제안되었다.
프라이버시: LLM4Code는 개인 정보 및 모델 훈련 데이터의 무단 사용과 관련된 프라이버시 문제에 직면할 수 있다. 멤버십 추론 공격이 이를 탐지하는 데 사용될 수 있다.
설명 가능성: LLM4Code의 예측 및 결정 과정을 이해하고 설명하는 것이 중요하다. 연구에서는 분류 작업과 생성 작업에 대한 설명 가능성을 평가하였다.
효율성: LLM4Code의 훈련 및 추론 시간, 메모리 사용량, 에너지 소비 등의 효율성이 중요하다. 파라미터 효율 미세 조정, 양자화, 모델 가지치기 등의 방법이 제안되었다.
사용성: LLM4Code의 사용 편의성, 생산성 향상 등의 사용성이 중요하다. 연구에서는 LLM4Code의 생산성 영향이 혼재되어 있음을 보여주었다.
이 논문은 각 비기능적 속성에 대한 현재 최신 기술과 동향, 기존 연구의 격차, 미래 연구 방향을 제시한다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies