本論文は、サイバーセキュリティにおいて重要な役割を果たすホワイトリストの作成に取り組んでいる。従来のホワイトリストは、ウェブサイトの人気度に重点を置いていたため、訪問頻度の低い正当なドメインを見落としていた。
DomainHarvesterは、ウェブのハイパーリンク構造を活用した新しい手法を提案している。シード URLから出発し、定期的なウェブクロールとDNSクロールを行い、信頼できるが人気の低いドメイン名を収集する。機械学習モデルとTransformerベースの言語モデルを活用し、信頼性を評価する。
DomainHarvesterは、グローバルフォーカスと地域重視の2種類のホワイトリストを生成する。既存の6つのトップリストと比較すると、重複は4%と0.1%と非常に低く、悪意のあるドメインを含む可能性も大幅に減少している。
この研究は、人気の低い信頼できるドメインに光を当て、DomainHarvesterというシステムを提案することで、ホワイトリストの包括性と精度を高めることに大きく貢献している。特に非英語圏のユーザーやビジネスにとって大きな利点がある。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询