以 2022 年旗艦手機 GPU 能力,stable diffusion 出圖需要多久?

前提:

沒有考慮 framework (例如 cuda) 的支援程度,單純考慮 GPU 的能力。

沒有考慮 GPU access memory 的效率差異。

已知資訊:

NVIDIA RTX A6000 出圖 (512x512) 時間為 8s. (*1)

NVIDIA RTX A4060 出圖 (512x512, 50 steps) 時間為 10s. (*4)

NVIDIA RTX 6000 的算力為 38.7 TFLOPS (single-precision). (*2)

NVIDIA RTX 4060 的算力為 20 TFLOPS (single-precision). (*5)

Apple A16 GPU 的算力為 2 TFLOPS (single-precision). (*3)

粗略估計:

Apple A16 出圖時間為

  8s * 38.7 TFLOPS / 2 TFLOPS ~= 155s (根據 *1 *2 *3)

  10s * 20 TFLOPS / 2 TFLOPS = 100s (根據 *4 *5 *3)

參考資料:

*1: All You Need Is One GPU: Inference Benchmark For Stable Diffusion

*2: NVIDIA RTX A6000 datasheet

*3: Apple A16 Bionic Benchmark, Test and specs

*4: 資訊來源: 友人

*5: Prices, Specs, and Everything Else We Know About Nvidia's RTX 4060 and RTX 4070 GPUs