DLSS 3:它如何運作、如何執行、何時應該使用它

Nvidia DLSS 3 可以說是最有趣的東西和GPU 推出。 即使有,我承認,有一些限制:而以前(深度學習超級取樣)版本已適用於所有 GeForce RTX 顯示卡,DLSS 3 目前僅可在這些 RTX 40 系列機型上使用。 或者將會是,一旦 RTX 4080 於 11 月 16 日上市。 然而,在 RTX 4090 上對其進行測試後,我相信它可能與顯示卡本身一樣重要,特別是如果您擁有高刷新率的話。

Marvel 的《蜘蛛人重製版》是首批獲得 DLSS 3 支持的遊戲之一。在 YouTube 上觀看

這主要歸功於 DLSS 3 的關鍵工具(基於 AI 的幀生成)對視覺性能的一些潛在巨大改進。 由於RTX 4080即將降價,正在滴答作響,讓我們仔細看看它是如何工作的,它每秒可以提供多少幀,以及 DLSS 3 是否有任何缺陷 - 除了它是一些非常“昂貴的顯卡”所獨有的。

DLSS 3:它是什麼以及它如何運作

從本質上講,DLSS 3 與 DLSS 2 類似,DLSS 2 是 Nvidia 現在用於 DLSS 版本 2.0 到 2.4 的統稱。 它是一個升級器,因此不是以顯示器的原始解析度渲染遊戲,而是以較低的解析度渲染每個幀,然後重建它們,使其看起來具有原始等級的清晰度。 結果是:由於較低渲染解析度的工作負載更容易,遊戲運行得更快,而且不會對影像的整體清晰度產生不利影響。 AMD FSR 和英特爾 XeSS 類似,但 DLSS 一直是升級者之王,因為它使用更複雜的機器學習/AI 技術來拼湊更準確的幀。 它還包含自己的抗鋸齒功能,該技術會涵蓋遊戲本身內建的 TAA 或 MSAA 技術,並且看起來比 TAA 或 MSAA 技術更清晰。

在許多情況下,使用 DLSS 2 的最高「品質」設定實際上可以使遊戲看起來均勻更好的與原生解析度渲染相比,同時仍提高 FPS 效能。 DLSS 3 並沒有改變這一點:它仍然包含自己的智慧 AA,並且在較高設定下看起來仍然一樣好,即使不是比原生解析度更好。

遊戲的變化在於 DLSS 3 的幀生成功能。 當開啟時(可選),GPU 將使用其 AI 智慧來創建全新的幀,並將它們悄悄地插入渲染的幀之間。 與升級過程不同,它使用周圍幀的資料來預測下一個產生的幀應該是什麼樣子。

這會立即帶來效能的進一步提升,幾乎不會對您的 PC 造成任何額外壓力,因為產生這些影格的資源密集程度遠低於渲染它們。 雖然我們稍後會討論這些「假」框架的外觀,但結果並不像某些客廳電視上的整體運動平滑效果那樣令人反感。 兩者都使用插值幀,但 DLSS 3 在如何從渲染管道收集資料來繪製它們方面更加複雜,因此看起來遊戲確實以更高的幀速率運行,而不是人為平滑。 我想這有助於我們的大腦不習慣於期望每個遊戲都以 24 fps 運行,就像電視節目和電影通常那樣。

正如更典型的遊戲升級者一樣,DLSS 3 仍然需要遊戲來實現對其的支持,而在早期,兼容遊戲庫更多的是一個單一的架子:在撰寫本文時,只有9 款遊戲可以使用DLSS 3玩。 不過,更多功能已確認即將推出,雖然您可以選擇開啟或關閉影格生成,但它始終會包含在 DLSS 3 的升級元件中。

DLSS 3:升級和產生的幀質量

我使用 RTX 4090 在三款遊戲中測試了 DLSS 3:,, 和。 正如 DLSS 2.4 後繼者所期望的那樣,DLSS 3 的升級看起來非常出色:在其品質甚至平衡模式下,升級的 4K 在所有三款遊戲中看起來都與原生 3840x2160 一樣好。 在第二快的效能模式下,我注意到 Microsoft Flight Simulator 中的水質有所下降,但就清晰度而言,你可以告訴我這是原生 4K,我會相信你的。 精細細節幾乎沒有任何捏造,物體周圍沒有奇怪的輪廓,基於人工智慧的抗鋸齒仍然優於您能找到的幾乎所有內建 AA 選項。

如果您只想使用 DLSS 3 進行升級,並關閉幀生成,那就這麼做吧 – 您將在支持它的遊戲中獲得出色的結果。 但這是可以預料的,對吧? DLSS 2.4 過去和現在都非常出色。 DLSS 3 的不同之處在於新增的生成幀,那麼它們看起來如何呢?

事實上,還不錯。 在大多數情況下,它們看起來 99% 都像傳統渲染的畫面。 下面是 F1 22 中隨機選擇的、完全由 AI 產生的幀(升級到 4K),後面是連續渲染的幀:

3840x2160,超高品質,DLSS 3 品質(產生的幀)
3840x2160,超高品質,DLSS 3 品質(渲染畫面)

紋理看起來相同,細節看起來相同,AA 看起來相同……唯一明顯的區別是 UI 部分有點混亂,圈時鐘位於右上角。 而且它是一個很小的細節,出現的時間很短(不到百分之一秒),因此在遊戲運行時不可能發現。 以下是放大的兩個幀,顯示了生成的幀與渲染幀的細節的匹配程度:

左:生成的幀。 右:渲染幀

這也是《微軟模擬飛行》和《Cyberpunk 2077》的典型特徵。 這是飛行模擬的生成框架…

3840x2160,超品質,DLSS 3 品質(產生的幀)

...與渲染的幀:

3840x2160,超品質,DLSS 3 品質(渲染幀)

再說一遍,除了一些在運動中不可見的混亂的用戶介面之外,沒有什麼值得一提的差異或降級。 第一次就錯過了? 這裡放大了:

左:生成的幀。 右:渲染幀

最後,《Cyber​​punk 2077》中的情況也是如此。

3840x2160,高品質,Psycho RT,DLSS 3 品質(生成的幀)

…但在其他方面與後續渲染的幀無法區分:

3840x2160,高品質,Psycho RT,DLSS 3 品質(渲染幀)

仔細放大,生成的幀中的道路障礙物周圍還存在一些微小的偽影,但在正常玩遊戲時,放大的螢幕截圖中值得注意的內容並不總是可見。 老實說,我在玩遊戲時沒有註意到這一點,也沒有註意到使用者介面問題。

左:生成的幀。 右:渲染幀

顯然,理想的情況是生成的幀絕對像素完美,但實際上並不需要如此。 相反,它們距離足夠近,以至於這些小問題無法用肉眼發現。 除非您要錄製它們,否則請將各個幀捕獲為 PNG,然後將它們上傳到您工作的 PC 遊戲網站。

在一種情況下,AI 生成會感到困惑,即場景或視角的突然變化使 DLSS 3 難以產生與先前幀一致的影像。 例如,在《F1》和《Cyberpunk 2077》中,您都可以快速切換駕駛鏡頭位置; 如果在切換發生時輪到 DLSS 3 產生幀,它將從不再使用的視角繪製所需的大部分視覺資料。 因此,像這樣的框架:

3840x2160,超高品質,DLSS 3 品質(產生的幀)

或這個:

3840x2160,高品質,Psycho RT,DLSS 3 品質(生成的幀)

在 F1 22 幀中尤其明顯的是,DLSS 3(祝福其棉襪)正在嘗試使用兩個完全不同的來源資料視角來估計影像。 但同樣,在運動中,這些錯誤或多或少是不可見的,因為它們在螢幕上出現的時間很短,然後就被完全準確的傳統渲染幀所取代。 當然,由於相機角度移動後獲得了更多影像數據,後續產生的畫面會自行校正。

我在兩款遊戲中積極尋找此類錯誤,快速交換視角以嘗試捕獲狡猾的幀,但即使盯著顯示器,我也無法將它們找出來。 在你注意到它們之前,它們就消失了,或者至少,它們很好地融入了周圍的框架,以至於變得難以察覺。

我唯一擔心的是,如果有任何支援DLSS 3 的中階/低端RTX 顯示卡,此類缺陷將變得更加明顯,因為較低的幀速率將使每一幀(包括不穩定的幀)在螢幕上停留更長時間。 不過,在 RTX 4090 和幾乎肯定是 RTX 4080 上,這都很好。 如果你截圖的話,幀生成錯誤可能會導致一些討厭點擊的 Twitter 活動,但實際上它們並不是一個問題。 總的來說,DLSS 3 看起來很棒。

DLSS 3:性能

DLSS 3 本身就可以平滑任何單幀 AI 錯誤,因為產生的額外幀代表了整體 FPS 速度的巨大爆發,以至於 RTX 4090 可以將其在 4K 下的平均性能提高一倍甚至三倍。

如下圖所示,當同時使用原生 4K 解析度和頂級品質圖形設定時,即使是 RTX 4090 在某些遊戲中也無法獲得穩定的 60fps。 但透過 DLSS 3 的組合升級和幀生成,《Cyberpunk 2077》和《微軟模擬飛行》中的幀率都達到了 100 fps 左右,《F1 2022》中的幀率也提高了近 100%。 這就是 DLSS 3 的最高品質設定; 速度更快,但銳利度稍差的性能模式可以走得更遠,與原生相比,《Cyberpunk 2077》的性能提高了三倍以上。

請注意,不確定飛行模擬中的性能模式發生了什麼,這可能是我測試的早期版本的問題。 否則,DLSS 3 顯然能夠實現 FPS 增益,而僅透過升級是不可能實現的,除非渲染解析度出現品質下降。 這可以讓您保持原生 4K 的所有清晰度,而不會影響效能。

除了僅限於少數極其昂貴的 GPU 之外,這可能會讓 DLSS 3 看起來像是 PC 性能魔法無可爭議的黃金標準; 任何 RTX 40something 擁有者都應立即在所有目前支援的遊戲以及將來可能推出的遊戲中啟用預設設定。 唉,事情沒那麼簡單。

原因與上述容易錯過的幀生成錯誤無關。 相反,這主要是遊戲中那個模糊定義(但非常真實)的概念的問題:感覺。

提高效能,無論是透過購買硬體升級、降低圖形設定還是採用升級等技巧,通常不僅僅是為了讓遊戲看起來更好——很多遊戲感覺以較高 FPS 運轉時效果較好。 瞄準變得更加敏銳。 轉向變得更靈敏。 MOBA 團戰不再那麼難以理解。 DLSS 3 可以透過其升級組件來實現這一崇高目標,但是那些 AI 產生的幀呢? 它們純粹是一種視覺輔助,你根本感覺不到它們。

這是我測試的一個例子。 《Cyberpunk 2077》在啟用 Psycho 射線追蹤的情況下以最大設定運行,在使用超品質 DLSS 3 和幀生成的情況下可以以約 100 fps 的速度運行。 偉大的! 看起來很可愛。 但我確實感覺到,武器瞄準和駕駛鏡頭移動並不像我期望的100 fps 那樣銳利和直接- 這一切都感覺很好,並且完全可玩,但可能更符合60 fps 遊戲的風格,而不是100 fps 的遊戲風格一。 果然,我關閉了幀生成(保持品質升級開啟),再次測量了性能,它的平均值是多少? 大約 60 幀/秒。 就我電腦的其他部分所知,這就是《Cyberpunk 2077》的運行速度,所以這就是我得到的輸入響應水平。 為什麼它會知道更多? 這些幀是假的,與實際渲染幀的裝配線分開。

另一個潛在的問題是輸入滯後。 DLSS 2 在開啟時引入了一點點,但具有訊框產生功能的 DLSS 3 則增加了更多。 明智的是,Nvidia 已頒布法令,任何具有 DLSS 3 的遊戲也必須支持,他們基於 GPU 的延遲削減技術; 透過這種協同運行,延遲最終保持在足夠低的水平,我可以愉快地玩《Cyberpunk 2077》或《飛行模擬》,而不會出現不利的遲緩現象。 儘管如此,這兩者都不是特別令人不安,並且有意地增加延遲對於更具競爭力的遊戲來說是一個很大的要求。

話又說回來,這可能是個永遠不會發生的擔憂。 減少一點延遲實際上可能會產生明顯變化的遊戲——主要是像這樣的射擊遊戲或者– 目前尚未出現在已確認的 DLSS 3 名冊中,即使有,它們也正在使用內建功能在較舊的低端硬體上以快速幀速率運行。 換句話說,他們一開始就不太可能需要 DLSS——不是為了它的升級,當然也不是為了它的幀生成。

DLSS 3:你應該使用它嗎?

我可以理解,與一般升級者相比,使用 DLSS 3 時要更加謹慎; 它當然包含比 DLSS 2 更厚的警告層,這對於任何具有相容卡的 PC 來說通常是理所當然的。

除了 DLSS 3 本身的硬體需求較窄之外,還需要足夠高規格的顯示器才能充分利用它。 A刷新率高於 100Hz 是最好的,但價格非常昂貴,儘管 1440p 顯示器會受益,但該解析度不會給遊戲帶來與 4K 相同的壓力。 因此,幀生成變得不太有用。

儘管如此,我對 DLSS 3 仍然非常樂觀,並認為如果您發現自己擁有相容的 GPU 和合適的顯示器,則應該嘗試一下。

它在高解析度下提供的效能提升幾乎令人難以置信 - 是的,它們可能由假幀組成,但請記住,後台仍在進行升級。 至少與嘗試在本機解析度下運行遊戲相比,這將改善遊戲的感覺。 即使它們對反應能力沒有幫助,是否真的有令人信服的理由放棄這些框架的額外視覺增強功能? 我想說不,當 Reflex 的延遲影響仍然很小,而那些偶爾的人工智慧產生錯誤在功能上不可見時,就不會了。

為了獲得最佳效果,請嘗試確保良好的性能等級(例如 60fps),並打開升級但關閉幀生成。 這意味著,如果您選擇添加這些額外的幀,它們提供的視覺效果將位於控制平滑度的堅實基線之上。