前提: 沒有考慮 framework (例如 cuda) 的支援程度,單純考慮 GPU 的能力。 沒有考慮 GPU access memory 的效率差異。 已知資訊: NVIDIA RTX A6000 出圖 (512x512) 時間為 8s. (*1) NVIDIA RTX A4060 出圖 (512x512, 50 steps) 時間為 10s. (*4) NVIDIA RTX 6000 的算力為 38.7 TFLOPS (single-precision). (*2) NVIDIA RTX 4060 的算力為 20 TFLOPS (single-precision). (*5) Apple A16 GPU 的算力為 2 TFLOPS (single-precision). (*3) 粗略估計: Apple A16 出圖時間為 8s * 38.7 TFLOPS / 2 TFLOPS ~= 155s (根據 *1 *2 *3) 10s * 20 TFLOPS / 2 TFLOPS = 100s (根據 *4 *5 *3) 參考資料: *1: All You Need Is One GPU: Inference Benchmark For Stable Diffusion *2: NVIDIA RTX A6000 datasheet *3: Apple A16 Bionic Benchmark, Test and specs *4: 資訊來源: 友人 *5: Prices, Specs, and Everything Else We Know About Nvidia's RTX 4060 and RTX 4070 GPUs