核心概念
高エネルギー効率のテキストから画像への拡散プロセッサーを提案する。
要約
この論文では、高品質な画像合成結果に注目されている安定した拡散プロセッサーが、モバイルプラットフォームでの展開を妨げる特性を持つことが指摘されています。提案されたプロセッサーは、3つの主要な機能を活用してスループットとエネルギー効率を実現しています。これらの機能には、パッチ類似性に基づく疎密度増強(PSSA)、テキストベースの重要ピクセルスポッティング(TIPS)、デュアルモードビットスライスコア(DBSC)アーキテクチャが含まれます。提案されたプロセッサーは28 nm CMOS技術で実装され、225.6 mWの平均消費電力で3.84 TOPSのピークスループットを達成しています。MS-COCOデータセットでは1イテレーションあたり28.6 mJの高エネルギー効率なテキストから画像への生成プロセッサーが実現可能です。
統計
提案されたPSSAにより、SASのEMAエネルギーが61.2%削減されました。
ベースラインと比較して、提案されたPSSAにより単一UNetの総EMAエネルギーが37.8%削減されました。
提案されたTIPSにより、FFN層の作業量の44.8%が低精度で処理可能となりました。
引用
"提案されたSDプロセッサは28 nm CMOS工程で構築され、1 V供給電圧および250 MHzクロック周波数で平均225.6 mWの消費電力と3.84 TOPSのピークスループットを達成しました。"
"MS-COCOデータセット上で評価した結果、このプロセッサは与えられたテキストから画像を生成し、CLIP LossおよびFID Lossがわずか<1%だけで成功しました。"
"提案されたSDプロセッサは14.94 TOPS/Wという高いピークエネルギー効率を達成しました。"