本稿では、従来のVision TransformerやU-Netアーキテクチャの課題を克服し、オンデバイス画像生成に適した、スケーラブルでトークン化不要、ハードウェア効率の高い新規ニューラルネットワークアーキテクチャを提案する。