이 연구에서는 피싱 웹사이트 탐지를 위한 강력한 프레임워크를 제안한다. 데이터 누출을 방지하기 위해 10-fold 교차 검증 전략을 사용하여 앙상블을 구축한다. 각 분류 알고리즘에 대해 가장 대표적인 특성 부분집합을 얻기 위해 순차적 특성 제거 기법을 사용한다. 10개의 다른 분류기를 학습시키고, 메타 분류기 학습을 위해 확률 값을 사용한다. 성능을 최적화하는 기본 학습기 조합을 결정하기 위해 탐욕 알고리즘 기반 선택 메커니즘을 구축한다. 최종적으로 깊은 신경망 구조를 메타 분류기로 사용하여 4개의 피싱 데이터셋에서 검증한다. 제안된 접근 방식은 다른 분류 알고리즘보다 우수한 성능을 보였으며, 기존 연구와 비교해서도 더 나은 결과를 얻었다. 다양한 데이터셋에서 높은 정확도와 일반화 성능은 제안된 접근 방식의 효과와 피싱 웹사이트 정확한 식별 능력을 보여준다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Asif Newaz,F... at arxiv.org 03-18-2024
https://arxiv.org/pdf/2403.09735.pdfDeeper Inquiries