核心概念
金融ニュースの関連情報を非関連情報から分離し、その中から予測と予報を特定することで、投資家の意思決定を支援する。
摘要
本研究は、金融ニュースの関連情報と予測・予報を自動検出するシステムを提案している。
まず、マルチパラグラフのトピック分割とコリファレンス解決を行い、著者の表現パターンを分離する。次に、Latent Dirichlet Allocation (LDA)によるトピックモデリングを用いて関連情報を検出し、その中で時間性分析とマシンラーニングを使って予測と予報を特定する。
提案システムは以下の特徴を持つ:
- マルチパラグラフのトピック分割とコリファレンス解決により、関連情報と非関連情報を分離
- LDAによるトピックモデリングで関連情報を検出
- 時間性分析とマシンラーニングで予測と予報を特定
実験データセットは2,158件の金融ニュースで、nlp研究者による手動アノテーションを行った。提案システムは、関連情報の特定とその中の予測・予報の特定で良好な性能を示した。
統計資料
ticker (stock:ticker_abr)株価は現在の価格から少なくとも55%割安である
ticker 2020年上半期の営業キャッシュフローは前年同期比で74.1%増加した
ticker 2020年上半期の自由キャッシュフローは137億ドルと前年同期比で74.1%増加した
引述
"boring is good"
"ticker reported "boring" earnings"