이 논문은 바이너리 코드 분석의 중요성과 데이터 부족 문제에 대해 설명한다. 저자는 이를 해결하기 위해 감독되지 않은 방식으로 바이너리 코드를 다른 ISA로 번역하는 모델 UNSUPERBINTRANS를 제안한다.
UNSUPERBINTRANS는 다음과 같은 과정을 거친다:
이렇게 훈련된 UNSUPERBINTRANS 모델은 저자원 ISA의 바이너리를 고자원 ISA(예: x86)로 번역할 수 있다. 이를 통해 고자원 ISA에 대해 훈련된 모델을 저자원 ISA의 바이너리 분석에 활용할 수 있다.
저자는 UNSUPERBINTRANS를 이용하여 코드 유사성 탐지와 취약점 발견 작업을 수행하였다. 실험 결과, UNSUPERBINTRANS는 높은 정확도를 달성하였다. 특히 취약점 발견 작업에서 UNSUPERBINTRANS는 모든 취약 함수를 정확하게 탐지할 수 있었다.
이 연구는 저자원 ISA의 데이터 부족 문제를 해결하고 다양한 바이너리 분석 작업에 활용할 수 있는 새로운 방향을 제시한다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Iftakhar Ahm... ב- arxiv.org 05-01-2024
https://arxiv.org/pdf/2404.19025.pdfשאלות מעמיקות