이 논문은 코드 생성을 위한 대규모 언어 모델(LLM4Code)의 비기능적 속성에 대한 체계적인 문헌 조사를 수행한다. 총 146개의 관련 연구를 검토하여 정확도 이외에 강건성, 보안, 프라이버시, 설명 가능성, 효율성 및 사용성의 7가지 중요한 속성을 식별하였다.
강건성: LLM4Code는 입력이 약간 변경되어도 일관되고 올바르게 수행할 수 있어야 한다. 연구에서는 화이트박스 및 블랙박스 평가 방법과 목표 공격 및 비목표 공격을 제안하였다. 또한 적대적 훈련, 마스크 훈련 등의 방법으로 강건성을 향상시킬 수 있다.
보안: LLM4Code는 데이터 중독 공격 및 백도어 공격에 취약할 수 있다. 연구에서는 이러한 공격을 평가하고 탐지하는 방법을 제안하였다. 자동 탐지 방법과 인간 검토 방법이 제안되었다.
프라이버시: LLM4Code는 개인 정보 및 모델 훈련 데이터의 무단 사용과 관련된 프라이버시 문제에 직면할 수 있다. 멤버십 추론 공격이 이를 탐지하는 데 사용될 수 있다.
설명 가능성: LLM4Code의 예측 및 결정 과정을 이해하고 설명하는 것이 중요하다. 연구에서는 분류 작업과 생성 작업에 대한 설명 가능성을 평가하였다.
효율성: LLM4Code의 훈련 및 추론 시간, 메모리 사용량, 에너지 소비 등의 효율성이 중요하다. 파라미터 효율 미세 조정, 양자화, 모델 가지치기 등의 방법이 제안되었다.
사용성: LLM4Code의 사용 편의성, 생산성 향상 등의 사용성이 중요하다. 연구에서는 LLM4Code의 생산성 영향이 혼재되어 있음을 보여주었다.
이 논문은 각 비기능적 속성에 대한 현재 최신 기술과 동향, 기존 연구의 격차, 미래 연구 방향을 제시한다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Zhou Yang,Zh... alle arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07506.pdfDomande più approfondite