[雜記] Jensen Huang w/ BG2 精彩訪談 2025/Sep part 3 - the ultimate co-design

為什麼 NVIDIA 前幾年開始從每兩年發布新架構,改為每年發布?

Token generation rate 指數成長 (Alibaba CEO Eddie Wu/Microsoft CEO Satya/OpenAI CEO Sam Altman):

1. 用戶數指數成長. (ChatGPT 在 2 years 內達到了 8 億個周活躍用戶)

2. 每個用戶產生數量更巨大的 tokens,因為用戶開始使用 reasoning 的功能。

因為上述兩種指數成長疊加,token generation rate 以驚人的速度成長,如果沒有大幅增加 AI 運算的性能,token generation 的成本會大幅增加。

因此 NVIDIA 必須每年大幅提升 AI 運算的性能。

AI 運算的能效在過去 10 年內提升了 10 萬倍 (從 Kepler 到 Hopper)。

而從 Hopper 到 Blackwell,AI 運算的能效在 1 年內就提升了 30 倍。

因為 Moore’s Law 已死,不能只依賴製程的進步來提升能效,NVIDIA 的挑戰在於把 AI 運算的整個環節在 system level 做拆解,同時優化 model, algorithm, system, chip (the ultimate extreme co-design)。

除了在 IP 層面 (CPU, GPU)、晶片層面、系統層面 (NVLink, Spectrum-X),還必須擴展到多個 AI factory 層面 (switches, networking)。

Source:
https://www.youtube.com/watch?v=mA85rfzvPzQ
31:10 - 37:48