Core Concepts
量的ファイナンス分野の論文をテキストマイニングし、トピックの変遷と著名な研究者や雑誌を明らかにする。
Abstract
本研究は、arXivに掲載された量的ファイナンス分野の論文を対象に、テキストマイニングを行い、以下の知見を得ている。
前処理フェーズでは、論文の長さや読みやすさなどの特徴を分析し、適切な前処理を行った。
トピックモデリングでは、Doc2VecとK-meansのクラスタリングが最も良好な性能を示した。30のトピッククラスターを抽出し、時系列でのトピックの変遷を分析した。
分散ファイナンス、ブロックチェーン技術、機械学習を用いた株価予測、健康・政策・社会的影響に関する研究などが近年増加傾向にある。一方で、ポートフォリオ最適化、オプション価格付け、ゲーム理論などの従来からの主要テーマも継続的に研究されている。
著者名と雑誌名の抽出を行い、量的ファイナンス分野の著名な研究者と雑誌を特定した。ただし、arXivへの投稿傾向の違いから、一部の著名研究者が十分に反映されていない可能性がある。
全体として、本研究はテキストマイニング手法を用いて、量的ファイナンス分野の研究動向を包括的に分析した。今後は、他のデータベースも活用し、より広範な研究動向の把握が期待される。
Stats
量的ファイナンス分野の論文数は近年増加傾向にある。
2022年までの16,000本の論文を分析した。