핵심 개념
고품질 이미지 생성을 위한 안정적인 확산 프로세서
초록
Abstract
안정적인 확산 프로세서 소개
모바일 플랫폼에 안정적인 확산의 배포를 방해하는 특성
제안된 프로세서의 핵심 기능: 패치 유사성 기반 희소성 증가, 텍스트 기반 중복 정밀도, 이중 모드 비트 슬라이스 코어 아키텍처
Introduction
생성적 AI 수요 증가
안정적 확산의 강점과 상용화
안정적 확산 모델 개요 및 주요 도전 과제
Effective Compression of Self-Attention Score
자기 주의 점수 비트맵 희소성 증가
패치 유사성 기반 XOR 유닛 소개
제안된 PSSA의 성능 분석
Text-based Mixed-Precision Processing
텍스트 기반 중복 정밀도 처리 소개
제안된 TIPS의 하드웨어 데이터 흐름
이중 모드 비트 슬라이스 코어(DBSC) 아키텍처 설명
Implementation Results
제안된 SD 프로세서의 레이아웃 사진 및 성능 요약
텍스트에서 이미지 생성 결과 및 평가
이전 트랜스포머 및 생성적 AI 프로세서와의 비교
통계
안정적 확산 프로세서는 28nm CMOS 기술로 구현되었으며 3.84 TOPS의 최대 처리량을 달성
제안된 프로세서는 225.6 mW의 평균 전력 소비와 28.6 mJ/iteration의 에너지 효율성을 달성
인용구
"제안된 SD 프로세서는 MS-COCO 데이터 세트에서 28.6 mJ/iteration의 높은 에너지 효율성을 달성할 수 있습니다."
"패치 유사성 기반 희소성 증가(PSSA)는 SAS의 EMA 에너지를 60.3% 감소시킵니다."