본 연구는 대규모 언어 모델(LLM)을 활용하여 정적 악성코드 분석 작업을 지원할 수 있는지에 대한 가능성을 타진한다. 저자들은 먼저 LLM이 생성한 설명 텍스트의 정확도를 평가하기 위해 분석 보고서와 LLM 출력을 비교 분석했다. 그 결과 LLM이 실질적인 수준의 정확도를 제공할 수 있음을 확인했다.
연구진은 사용자 연구를 통해 LLM을 분석 지원 도구로 활용할 수 있는지 검증하고, 향후 실용화를 위해 개선해야 할 부분을 파악하고자 했다.
본 연구에서는 정적 분석 경험이 있는 6명의 분석가가 참여했다. 이들은 LLM이 생성한 악성코드 기능 설명을 활용하여 모의 악성코드 분석 작업을 수행했다. 분석 후에는 설문조사와 인터뷰를 통해 LLM 출력의 유용성과 실용성을 평가했다.
본 연구는 LLM이 정적 악성코드 분석 작업을 지원하는 데 유용한 도구가 될 수 있음을 시사한다. 하지만 실제 환경에서 LLM을 효과적으로 활용하기 위해서는 앞서 언급된 개선 사항들을 해결하는 것이 중요하다. 향후 연구에서는 더 많은 정적 분석가를 대상으로 인터뷰를 진행하고, LLM을 활용한 정적 분석 지원 시스템을 구축하여 사용성을 평가할 예정이다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Shota Fujii,... at arxiv.org 11-25-2024
https://arxiv.org/pdf/2411.14905.pdfDeeper Inquiries