本論文は、新興プラットフォームへの機械学習システムの展開に関する取り組みを報告している。従来の底上げ型の開発手法では、新興プラットフォームへの対応が遅れがちであったが、本研究では、トップダウン型のアプローチであるTAPMLを提案している。
TAPMLの主な特徴は以下の通り:
テストの自動生成: 既存のCUDAなどの成熟したプラットフォームの実行履歴からオペレーター単位のテストケースを自動生成する。これにより、手動でのテストケース作成の手間を大幅に削減できる。
段階的なオフローディング: 新興プラットフォームへの移行を、既存プラットフォームからの段階的なオフローディングとして捉える。これにより、デバッグ範囲を最小限に抑えることができる。
ユニバーサルランタイム: プラットフォーム間の連携を容易にするユニバーサルなランタイムを提供する。これにより、プラットフォーム固有の複雑な処理を隠蔽できる。
著者らは、1年間にわたる取り組みの中で、82の新興モデルを17の異なるアーキテクチャで5つの新興プラットフォームにデプロイしている。その過程で得られた知見を詳細に報告しており、新興機械学習システムの開発における有用な実践例を示している。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Siyuan Feng,... ב- arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09151.pdfשאלות מעמיקות