Core Concepts
大規模なデータテンソルコレクションに対する情報アクセスを効率化するためのサンプル効率的学習方法を提案。
Abstract
データテンソルは2次以上で生成され、科学的および医療データに使用される。
ランダムなスケッチングアルゴリズムが低ランク近似を生成するために人気がある。
Progressive Sketching(P-SCT)は最適なサブサンプリングポリシーを活用して、テンソルスケッチングを最適化する新しい手法。
P-SCTはR-SCTと比較してサンプリング効率が高く、精度が向上していることが示されている。
Stats
ノースアメリカ地域再解析(NARR)は現在29.4テラバイトのデータサイズに達している。
3つの異なる次元から成るデータテンソルAでは、行列展開A(1)、A(2)、A(3)が定義されている。
Quotes
"ランダムなスケッチングアルゴリズムは非常に大きな行列やテンソルの低ランク近似を生成するための人気のある手法です。"
"Progressive Sketching(P-SCT)は最適なサブサンプリングポリシーを活用して、テンソルスケッチングを最適化します。"