核心概念
本稿では、データの密度ベースクラスタリングアルゴリズムであるHDBSCAN*の minpts パラメータを自動的に選択する手法と、その結果得られる異常値スコアを用いて異常値を識別するための閾値を自動的に決定する手法を提案する。
Ghosh, K., Naldi, M. C., Sander, J., & Choo, E. (2024). Unsupervised Parameter-free Outlier Detection using HDBSCAN* Outlier Profiles. arXiv preprint arXiv:2411.08867.
本研究は、HDBSCAN* を用いた教師なし異常値検出手法である GLOSH において、最適な minpts パラメータ値と異常値検出閾値を自動的に決定することを目的とする。