Core Concepts
LLM은 코드 분석에 유용한 도구일 수 있지만 일부 제한이 존재한다.
Abstract
대규모 언어 모델(LLMs)은 자연어 이해 및 프로그래밍 코드 처리 작업에서 중요한 잠재력을 보여줌
LLMs는 코드 분석 작업에 유용한 도구로 사용될 수 있음
코드 분석에 대한 LLMs의 능력을 평가하기 위해 실제 사례 연구를 제시
LLMs는 코드 분석을 자동화하는 데 유용할 수 있지만 일부 제한이 존재함
Introduction
LLMs의 중요성 및 코드 분석에 대한 연구의 필요성 소개
Background
LLMs의 기술적 배경 및 코드 분석, 코드 난독화에 대한 개요
Experiment Settings
LLM 선택 및 프롬프트 구성에 대한 설명
Results
비난성 코드 및 난독화된 코드에 대한 결과 및 평가
Case Studies
Github 저장소 및 모바일 플랫폼 바이러스 분석 사례 연구
Stats
LLM은 코드 분석 작업에 대한 높은 정확도를 보임
GPT-4는 난독화된 코드 분석에서 더 나은 성능을 보임
Quotes
"The code validates the entered phone number using a regular expression. If the phone number is not valid, a toast message is displayed. Otherwise, the code requests the ‘RECEIVE_SMS’ permission and checks if the permission is granted." - GPT-3.5
"It builds a URL string by appending the ‘url’ and ‘info’ (user phone number) parameters to a base URL. It then sends a GET request to this URL using the AndroidNetworking library’s ‘get()‘ method." - GPT-3.5