本地运行文生图模型应用
————————————
使用 Snapdragon NPU 加速在 Android 上运行 Stable Diffusion。还支持CPU/gpu推理。
NPU 支持的设备:
- 骁龙 8gen1
- 骁龙8+第一代
- 骁龙 8gen2
- 骁龙 8gen3
- 骁龙 8gen4
CPU支持的设备:
- 全部
技术实施
NPU加速
SDK:利用 Hexagon NPU 的高通 QNN SDK
量化:W8A16静态量化以实现最佳性能
分辨率:固定 512×512 模型形状
性能:极快的推理速度
CPU/GPU 推理
框架:由 MNN 框架提供支持
量化:W8 动态量化
分辨率:灵活尺寸(128×128、256×256、384×384、512×512)
性能:速度适中,兼容性高
NPU 高分辨率支持
下载 512 分辨率模型后,您可以下载补丁以启用 768×768 和 1024×1024 图像生成。请注意,量化高分辨率模型可能会产生布局不佳的图像。我们建议首先以 512 分辨率生成,然后使用 img2img 的高分辨率模型(本质上是 Highres.fix)。建议的 img2img denoise_strength约为 0.75。
设备兼容性
NPU 加速支持
兼容具有以下特点的设备:
骁龙 8 Gen 1
骁龙 8+ 第 1 代
骁龙 8 Gen 2
骁龙 8 第 3 代
骁龙8精英
注意:其他设备无法下载 NPU 模型
CPU/GPU 支持
RAM 要求:~2GB 可用内存
兼容性:近年来的大多数 Android 设备