Core Concepts
AMD Zen+のポートマッピング推論アルゴリズムの研究と評価
Abstract
パフォーマンスモデルはコード最適化に重要
uops.infoプロジェクトのポートマッピング推論アルゴリズムを改変し、AMDプロセッサに対応
AMD Zen+アーキテクチャでのポートマッピング推論を実施し、結果を提供
Introduction:
パフォーマンスモデルはコード最適化に不可欠
uops.infoはIntel向けに正確なポートマッピング提供、AMDのZenアーキテクチャでは未対応
本研究では、AMD Zen+アーキテクチャで新しいポートマッピング推論アルゴリズムを提案
Background:
現代のマイクロアーキテクチャはパフォーマンス向上のため多くの技術を使用
出力されるµop数が予想外に異なる場合がある(例:メモリオペランド)
µopカウントに関する問題点があり、正確なµop数を測定する必要性
Data Extraction:
"Retired Uops"カウンターはµop数を正確にカウントしないことが観察された。
µop数として記録されているものは実際にはmacro-opである可能性がある。
Stats
"Retired Uops"カウンターはµop数を正確にカウントしないことが観察された。