Core Concepts
実世界のデータセットにおけるコンセプトドリフトへの対処方法を提供する。
Abstract
インターネット上でのテキストデータから学習する必要性
テキストデータ分析の課題とコンセプトドリフトの重要性
テキストドリフト生成方法とその評価結果
ISVMが最も効率的な結果を示すことが明らかになった
Stats
コンセプトドリフトは、時間経過に伴うデータ分布の変化を指す。
結果は、ISVMが最も高い精度とマクロF1スコアを示したことを示している。
Airbnbデータセットでは、GNBやARFよりもISVMが優れたパフォーマンスを発揮した。
Quotes
"Concept drift is a frequent phenomenon in real-world datasets and corresponds to changes in data distribution over time."
"Results show that all methods have their performance degraded right after the drifts, and the incremental SVM is the fastest to run and recover the previous performance levels."