Grunnleggende konsepter
Advance cybersecurity capabilities through machine learning techniques using the Mal-API-2019 dataset.
Sammendrag
この研究は、Mal-API-2019データセットを使用して機械学習技術を活用し、マルウェアの検出能力を向上させることに焦点を当てています。論文では、異なる分類モデルの評価に焦点を当て、Random ForestやXGBoostなどのアンサンブルおよび非アンサンブルの機械学習手法が探求されます。特にデータ前処理技術の重要性が強調され、TF-IDF表現や主成分分析などがモデルのパフォーマンス向上に寄与することが示されます。結果は、Random ForestやXGBoostなどのアンサンブル手法が他よりも優れた精度、適合率、再現率を示すことで、マルウェア検出における効果的性能を強調しています。
Statistikk
データ前処理技術はTF-IDF表現や主成分分析などでモデルパフォーマンス向上に貢献します。
Random ForestとXGBoostは平均精度0.68で優れたパフォーマンスを示しました。
K Nearest Neighbor (KNN)は平均精度0.54で比較的低い結果でした。
Neural Networksモデルは平均精度0.56を示しました。
Sitater
"Both ensemble and non-ensemble machine learning methods are explored, such as Random Forest, XGBoost, K Nearest Neighbor (KNN), and Neural Networks."
"The results indicate that ensemble methods, particularly Random Forest and XGBoost, exhibit superior accuracy, precision, and recall compared to others."
"The study aims to equip cybersecurity professionals, researchers, and policymakers with informed perspectives for enhancing malware detection systems in the face of evolving cyber threats."