本週的Digital Foundry Direct 直接來自拉斯維加斯,奧利弗·麥肯齊(Oliver Mackenzie) 和亞歷克斯·巴塔利亞(Alex Battaglia) 分享了他們對展廳展示的技術的印象- 首先概述了Nvidia RTX 50 系列的展示主題演講。我將在本週的部落格中解決該簡報中的一個主張。即將推出的 RTX 5070 真的能提供 RTX 4090 系列的「效能」嗎?根據既定的說法,答案當然是不,但這種說法背後的原因足夠簡單,並且對接下來的時代具有先見之明:透過硬體實現的幀速率的巨大飛躍正在減弱,無論你喜歡與否,未來都是如此。
為了正面解決 Nvidia 的 RTX 5070 主張,性能平等的概念完全基於 DLSS 4 多幀生成的實現,其中新的 549 美元 GPU 可能是針對運行相同分辨率和設置但僅使用單幀的 RTX 4090 進行測試的一代。從所有可量化的指標來看,這種說法都站不住腳。即使在更現代的架構和流程節點上運行,RTX 5070 的 6,144 個 CUDA 核心也無法與 RTX 4090 的 16,384 個相比——這意味著在 RT 和張量核心方面存在類似的差距。 RTX 4090 上的 384 位元內存介面讓位於 RTX 5070 上的 192 位元匯流排。 雖然 RTX 5070 具有更快的內存,但它只有 12GB,而即將推出的機器為 24GB。
簡而言之,如果沒有 DLSS 4,RTX 5070 將無法與 RTX 4090 匹敵 - 除非我們談論的是運行到顯示器刷新率極限(垂直同步或上限)的相對簡單的遊戲。從表面上看,Nvidia 的說法很荒謬,但 CES 上的實際報告像這個來自 PC Games N 的評論是免費的,詳細介紹了 Marvel Rivals 演示,其中顯示 5070 的幀生成顯示出比 4090 高得多的幀速率,儘管顯然奇偶校驗更常見。我的猜測是,Marvel Rivals 在這個演示中受到CPU 限制,其中幀生成顯示了幀速率的最大乘數,但即便如此,DLSS 4 仍然給人留下了積極的印象,並且幀速率聲明得到了證實,儘管有一個附有大AI星號。
- 0:00:00介紹
- 0:01:47Nvidia CES 演示 - RTX Mega Geometry
- 0:14:25RTX 神經材料
- 0:21:24RTX 神經臉孔和 RTX 頭髮
- 0:31:37ReStir 路徑追蹤 + 巨型幾何
- 0:36:49帶有 DLSS 4 的黑州
- 0:42:47心靈殺手 2 與 DLSS 4
- 0:46:01總決賽中的《反射2》
- 0:53:22AMD 在 CES 上:AI 降噪器示範、Lenovo Legion Go 手持裝置
- 1:03:51Razer 在 CES 上:筆記型電腦散熱墊、新款 Razer Blade
- 1:11:30華碩和英特爾在 CES 上
- 1:17:29CES 顯示器:Mini-LED、Micro-LED、OLED + 顯示器罪惡!
- 1:30:07支持者Q1:Switch 2支援DLSS 4嗎?
- 1:32:22支持者Q2:你在CES上看過Switch 2的模型嗎?
- 1:33:56支持者 Q3:您能否針對超高解析度「地面實況」影像測試 DLSS?
- 1:37:52支持者 Q4:為什麼開發人員會使用 Nvidia 開發的渲染技術而不是 UE5 同等技術?
- 1:40:38支持者Q5:多幀生成能解決遊戲卡頓問題嗎?
- 1:42:05支持者 Q6:多幀生成會讓 VRR 過時嗎?
- 1:44:27支持者 Q7:索尼是否後悔在遊戲機業務上繼續與 AMD 合作?
- 1:49:49支持者Q8:您覺得《FF7重生》的PC規格如何?
- 1:52:37支持者Q9:你在CES展場上見過的最瘋狂的事情是什麼?
我敢打賭,Nvidia 在知道這個想法會受到嚴格審查的情況下進行了 5070/4090 的比較。該公司顯然相信,即使 5070 體驗的負面因素凸顯出來,接下來的所有測試都將對其聲稱產生積極的影響。在殘酷的 SEO 層面上,5070/4090 的比較越多,原始聲明獲得的演算法提升就越大。
因此,在花了一些時間使用 DLSS 4 後,我可以預測這些比較將如何進行。首先,在確實使用超過 12GB RAM 的遊戲中,RTX 5070 的限制將導致視覺效果下降或幀速率降低。印第安納瓊斯與大圈將是一個有趣的測試案例。在其他遊戲中,幀率方面可能與 RTX 4090 相當,但輸入延遲會更高,並且可能會出現更多幀生成偽影。輸入幀產生的基本幀速率越高,對輸入延遲的影響就越不明顯,而最終的輸出幀速率可能會很快,從而使幀生成偽影不太明顯 - 但 RTX 4090應該還是看起來更好,玩得更好。
《Marvel Rivals》作為最佳案例場景進行測試可能很有趣,但它將是「全 RT」路徑追蹤遊戲,例如和這確實讓 5070/4090 真正通過了它的競爭 - 最終,這種比較是關鍵。雖然即使在沒有幀生成的 4070 級硬體上也可以享受路徑跟踪,但完整的花哨體驗被認為是 4090 獨有的,並且承諾這種級別的“性能”現在只需 549 美元產品。
延遲增加是 DLSS 4 無法完全解決的幀產生的關鍵限制。該技術的工作方式很簡單:產生標準渲染幀,然後緩衝下一幀(導致延遲)。然後,frame-gen 計算在標準渲染幀之間顯示的一、兩個或三個插值幀(您可以使用 DLSS 4 選擇)。 Nvidia 強制要求使用其 Reflex 延遲減少技術來縮小差異。 DLSS 多幀產生使用相同的系統,但有一點不同:額外的內插幀生成得非常非常快。在我的測試中,與現有的幀生成技術相比,透過添加兩個幀,延遲大約增加了 6.4 毫秒。
此時,我應該暫停一下並糾正我在 YouTube 評論中註意到的一些誤解,這些誤解是我們上週發布的 DLSS 4 影片(嵌入在下面)。延遲指標與幀時間混淆,因此《Cyberpunk 2077》的 50 毫秒延遲被比作 20 fps 的幀速率。事實是,即使目標相同的性能水平,每個遊戲也會有不同程度的延遲 - 正如 Tom Morgan 所證明的那樣回到過去。 Tom 的延遲指標顯示,一堆鎖定在 60 fps 運行的遊戲提供了截然不同的輸入延遲:儘管兩款遊戲都鎖定在 60 fps 運行,比《毀滅戰士 2016》有 47.5 毫秒的延遲優勢(!),比電競熱門遊戲有 37.3 毫秒的延遲優勢,。事實是,延遲很重要,但在許多情況下,這些差異比幀生成所增加的延遲要高一些。幀速率顯然更明顯,輸入延遲的增加則不那麼明顯。何時有人抱怨《毀滅戰士》或《鬥陣特攻》的延遲?
接下來我想談談「表演」這個詞。當我們首次推出 DLSS 3 時,我們談到了幀生成帶來的效能倍增。英偉達將繼續這樣做。然而,社群的回饋讓我思考「性能」是否是最合適的術語。在整個 3D 時代,幀速率的提高與輸入延遲的減少齊頭並進。這是性能提升所有區域。是否為幀生成真的如果延遲較高,效能會提升嗎?
這是一個很好的觀點,然後我進一步思考了這一點:如果 2x 幀生成沒有提供 2 倍的幀速率提升,那麼我們實際上不是得到了更少標準渲染幀?當 RTX 4090 評測出現時,我接受了回饋,現在將幀速率的提高稱為幀速率提升 - 但不是性能提升。我之所以這麼區分,是因為效能不僅僅是幀速率,即使嚴格來說,它是 GPU「效能」的衡量標準,只是用不同的術語。所謂的「假」框架?只有當人工製品明顯且引人注目時,這才是一個問題。就像延遲一樣,它仍然是一個問題,但最終我希望這兩個問題都能得到解決。
讓我們明確一點 - Nvidia 的 5070/4090 聲明是該公司為所有供應商都會接受的新範例奠定了基礎。這是因為越來越明顯的是,圖形技術的未來將更多地偏向人工智慧生成,是的,光線追踪,而不是更大的 GPU 和更多著色器。一定是這樣,因為最新的半導體製造工藝的成本只會朝一個方向發展——但如果你想要傳統意義上的更多“性能”,你就需要為此付出更多的代價。即便如此,根據本週的 Direct,您會發現許多正在取得的進步純粹是由機器學習驅動的。
最後,這是否只是 Nvidia 的一個大騙局——我們經常聽到的另一種說法?好吧,如果本週 Direct 中討論的技術沒有影響您,我當然會引用與 AMD 合作的 Mark Cerny 的這句話:「我們透過 PS4 Pro 等產品製定的策略...我不會說它已經達到了極限,但主要是為了讓GPU 更大或內存更快。一切......”