핵심 개념
DomainLynx는 대규모 언어 모델을 활용하여 다양한 유형의 도메인 스쿼팅을 효과적으로 탐지할 수 있는 혁신적인 복합 AI 시스템이다.
초록
이 연구는 DomainLynx라는 혁신적인 도메인 스쿼팅 탐지 시스템을 소개한다. DomainLynx는 대규모 언어 모델(LLM)을 활용하여 기존 방법의 한계를 극복하고 다양한 유형의 스쿼팅 기법을 식별할 수 있다.
DomainLynx의 핵심 구성요소는 다음과 같다:
입력 데이터 처리: 다양한 출처의 도메인 데이터를 수집한다.
도메인 이름 확장(DNX): 벡터 데이터베이스 기술을 활용하여 잠재적인 스쿼팅 도메인과 정상 도메인을 매칭한다.
위협 인식 검증(TRV): LLM을 활용하여 스쿼팅 위험을 평가하고, 신뢰성 있는 결과를 도출하기 위한 기술을 적용한다.
출력 생성: 고위험 도메인 목록을 생성한다.
이 시스템은 Tranco 상위 1,000개 도메인을 대상으로 한 Ground Truth 데이터셋에서 94.7%의 정확도를 달성했다. 실제 환경에서의 1개월 테스트에서는 2,099,184개의 새로 관찰된 도메인 중 34,359개의 잠재적 스쿼팅 도메인을 탐지했으며, 이는 기존 방법보다 2.45배 높은 성능이다. 특히 탐지된 도메인의 85.65%가 상위 1,000개 도메인 외의 것으로, DomainLynx가 인지도가 낮은 온라인 엔티티에 대한 보호에도 효과적임을 보여준다.
이 연구는 사이버 보안 분야에서 LLM 기반 접근법의 잠재력을 보여주며, 진화하는 도메인 스쿼팅 위협에 대한 강력하고 적응력 있는 대응책을 제시한다.
통계
1,649개의 스쿼팅 도메인 중 94.7%를 정확하게 탐지했다.
2,099,184개의 새로 관찰된 도메인 중 34,359개의 잠재적 스쿼팅 도메인을 탐지했다.
탐지된 스쿼팅 도메인 중 85.65%가 상위 1,000개 도메인 외의 것이었다.
인용구
"DomainLynx는 대규모 언어 모델을 활용하여 다양한 유형의 도메인 스쿼팅을 효과적으로 탐지할 수 있는 혁신적인 복합 AI 시스템이다."
"DomainLynx의 능력은 사이버 보안 분야에서 LLM 기반 접근법의 잠재력을 보여주며, 진화하는 도메인 스쿼팅 위협에 대한 강력하고 적응력 있는 대응책을 제시한다."