이 연구는 사이버 보안 작업을 위한 대화형 AI와 생성 AI를 포함하여 사이버 보안 과제에 GPT-3 모델을 미세 조정하는 데 초점을 맞추고 있습니다. CYGENT는 사용자에게 사이버 보안 정보를 제공하고, 업로드된 로그 파일을 분석 및 요약하며, 특정 이벤트를 감지하고 필수 지침을 전달합니다. 대화형 에이전트는 GPT-3.5 터보 모델을 기반으로 개발되었습니다. 수동으로 생성된 데이터 포인트를 사용하여 요약기 모델(GPT3)을 미세 조정하고 검증했습니다. 이 접근법을 통해 97% 이상의 BERTscore를 달성하여 GPT-3의 로그 파일을 사용자 친화적 형식으로 요약하고 사용자에게 필요한 정보를 제공하는 향상된 기능을 입증했습니다. 또한 로그 분석 기술을 분석하기 위해 GPT-3 모델과 CodeT5-small, CodeT5-base, CodeT5-base-multi-sum을 포함한 다른 대형 언어 모델(LLM)의 비교 분석을 수행했습니다. 분석 결과 Davinci(GPT-3) 모델이 다른 모든 LLM을 능가하는 높은 성능을 보였습니다. 이러한 결과는 IoT 장치 수가 증가함에 따라 로그에 대한 인간의 이해를 높이는 데 중요합니다. 또한 우리의 연구는 CodeT5-base-multi-sum 모델이 이 작업에서 Davinci와 비교 가능한 성능을 보여 오프라인 모델로 사용할 수 있는 잠재력을 시사합니다.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Prasasthy Ba... klo arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17160.pdfSyvällisempiä Kysymyksiä