본 연구는 대규모 언어 모델(LLM)을 활용하여 정적 악성코드 분석 작업을 지원할 수 있는지에 대한 가능성을 타진한다. 저자들은 먼저 LLM이 생성한 설명 텍스트의 정확도를 평가하기 위해 분석 보고서와 LLM 출력을 비교 분석했다. 그 결과 LLM이 실질적인 수준의 정확도를 제공할 수 있음을 확인했다.
연구진은 사용자 연구를 통해 LLM을 분석 지원 도구로 활용할 수 있는지 검증하고, 향후 실용화를 위해 개선해야 할 부분을 파악하고자 했다.
본 연구에서는 정적 분석 경험이 있는 6명의 분석가가 참여했다. 이들은 LLM이 생성한 악성코드 기능 설명을 활용하여 모의 악성코드 분석 작업을 수행했다. 분석 후에는 설문조사와 인터뷰를 통해 LLM 출력의 유용성과 실용성을 평가했다.
본 연구는 LLM이 정적 악성코드 분석 작업을 지원하는 데 유용한 도구가 될 수 있음을 시사한다. 하지만 실제 환경에서 LLM을 효과적으로 활용하기 위해서는 앞서 언급된 개선 사항들을 해결하는 것이 중요하다. 향후 연구에서는 더 많은 정적 분석가를 대상으로 인터뷰를 진행하고, LLM을 활용한 정적 분석 지원 시스템을 구축하여 사용성을 평가할 예정이다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Shota Fujii,... a las arxiv.org 11-25-2024
https://arxiv.org/pdf/2411.14905.pdfConsultas más profundas