Nvidia GeForce RTX 4090 評測:一款極其昂貴的旗艦 GPU,帶有 DLSS 3 魔力

在看到 Nvidia GeForce RTX 4090 後,您可能已經知道您是否願意並且能夠購買它,所以這是以下評論的簡短版本:是的,就純粹的性能而言,它是對於4K你可以獲得。是的,DLSS 3 是貨真價實的。不,這些都不能讓 RTX 4090 物有所值,即使它為 Nvidia 最新的升級技術提供了令人信服的論據。

我用於測試成本的 Zotac Gaming GeForce RTX 4090 Amp Extreme Airo 型號1960英鎊/1700 美元;相對於已經很高的 RTX 4090 基礎建議零售價(建議零售價)為 1679 英鎊/1599 美元,這兩款產品的溢價都很高,尤其是在英國。對於許多人(如果不是大多數個人電腦擁有者)來說,這一切可能看起來都是深不可測的財富。尤其是使用上一代最快的 Nvidia GPU,和,現在售價分別低於 1100 英鎊和 1200 英鎊。

在 YouTube 上觀看

對於您的二合一遊戲來說,您獲得的顯卡甚至可能無法放入您電腦的中塔式機箱中。 RTX 4090 Amp Extreme Airo 長 355.5 毫米,寬 165.5 毫米,跟隨我評測的 Zotac RTX 3090 Ti 的腳步,在拆下 AIO 冷卻器和風扇後,僅將其擠入我的測試 PC 的 NZXT H510 機箱中 - 讓後者在機箱外旋轉,就像環境危害。即使沒有必要,巨大的電路板和三風扇冷卻器也太寬了,試圖重新安裝機箱的玻璃側面板會將邊緣的 PSU 電纜適配器壓壞一半。需要不少於的適配器8 針電源線為該卡供電,該卡具有與 RTX 4090 相同的 450W 額定功耗。

那麼,它是一個需要高度維護的組件,儘管至少其規格相當巨大。 RTX 4090 包含 16,384 個 CUDA 核心,比次優產品多出 6,600 多個核心。它還具有 24GB 384 位 GDDR6X 的 VRAM,並且在該型號上,Zotac 將升壓時鐘速度從 2520MHz 提高到 2580MHz。小幅超頻,但請記住,RTX 3090 Ti 的 CUDA 核心數量減少了約 5,600 個,並且僅在庫存時將其提升至 1860MHz。

這太愚蠢了。不要這樣做。

然後還有一些不太列出的規格,例如構成 RTX 40 系列 Ada Lovelace 架構的底層升級。所有 RTX 40 GPU 都具備這些功能,不僅僅是 RTX 4090,而且還具有重新設計的 RT 核心和 Tensor 核心,有望增強光線追踪性能並改進性能方面,很明顯 Nvidia 不僅僅希望傳統光柵化遊戲有更快的幀速率。這家圖形巨頭還通過 DLSS 3 進一步推進其人工智能機器學習,DLSS 3 是一種獨特的新型升級器,可以比以前的 DLSS 版本帶來更大的 FPS 提升。當然,具體而言,是受支持的遊戲。

Nvidia GeForce RTX 4090 評測:4K 性能

更多信息即將發布,但首先,這是 RTX 4090 最喜歡的分辨率的核心性能內幕。

得益於 RTX 30 和 AMD Radeon RX 6000 系列中的高端 GPU,您已經擁有一系列顯卡選項,可以在 4K 下達到 60fps,而無需在設置質量方面做出太多犧牲。即便如此,RTX 4090 代表了真正的代際飛躍,除了幾個光柵化(非光線追踪)基準測試之外,其他所有基準測試的平均幀率都達到 100 fps 或更高。即使沒有,它仍然創造了創紀錄的分數,例如 79fps賽博朋克2077和 84fps看門狗軍團

後者比 RTX 3090 Ti 的幀率高 14fps,考慮到價格差異,這可能會令人失望。但 RTX 4090 在其他方面都碾壓了 Ampere GPU,尤其是在要求苛刻的情況下全面戰爭:三個王國戰鬥基準。在 Ultra 質量下,RTX 4090 巡航至 100 fps,比 RTX 3090 Ti 高出 40 fps。這應該會讓任何擁有其中之一的人感到高興具有 120Hz 或 144Hz 刷新率。

古墓麗影之影也看到了很大的躍升,從 RTX 3090 Ti 上的 75fps(使用 SMAA x4 抗鋸齒的最高預設)到 RTX 4090 上的 125fps。這是 67% 的提升!刺客信條瓦爾哈拉幀速率也從 73 fps 大幅提升至 100 fps,同時地平線零之曙光在終極質量下,幀速率從 98 fps 攀升至 127 fps。

同樣,您需要花費大量資金購買具有更高刷新率的 4K 顯示器才能看到這些差異,但它們足夠寬以可見。正如情況一樣最終幻想15,特別是當您打開全套 Nvidia 獨有的獎勵(例如 HairWorks 和 TurfEffects)時。將這些添加到最高預設後,RTX 4090 的平均幀率為 88fps,輕鬆超過了 RTX 3090 Ti 的 61fps 結果。如果沒有這些功能,RTX 4090 的平均幀率為 108fps,以類似的比例擊敗 RTX 3090 Ti 的 89fps。

地鐵:離去這是 RTX 4090 的另一項重大勝利,它在 Ultra 質量下達到了 107fps;比 RTX 3090 Ti 快 24fps。殺手3在迪拜基準測試中,RTX 4090 在 Ultra 質量下的平均幀速達到了驚人的 174 fps,不過由於 RTX 3090 Ti 在相同設置下的平均幀速為 135 fps,因此您需要 240 Hz 顯示器和鷹眼才能看出其中的差異。

還值得注意的是,在極限競速:地平線 4,兩個 GPU 實際上得分均等:均為 159fps。這表明這兩張卡實際上已經突破了測試 PC 的 Core i5-11600K CPU 的限制,因此在遊戲發布四年之前,我可能會逐步將其從我們的基準測試方案中淘汰,轉而採用極限競速地平線 5。我沒有 RTX 3090 Ti 的結果,但 RTX 4090 在 Extreme 預設下的平均幀速率為 111fps,因此即使續作提出了更嚴格的技術要求,它顯然仍然能夠實現流暢的幀速率。

Ada Lovelace 的光線追踪優化(其中還包括新的“著色器執行重新排序”功能,可讓 RTX 40 GPU 更有效地處理 RT 渲染上的數字)確實也取得了成果。拿:在使用 Ultra 預設和 Ultra-quality 光線追踪的情況下,RTX 4090 的平均幀速率為 80fps,比非 RT 性能下降了 25%。基於 Ampere 的 RTX 3090 Ti?使用 RT 時,幀率從 83 fps 下降到 53 fps,損失了 36%。因此,RTX 4090 不僅在直接 FPS 競賽中憑藉光線追踪效果速度更快,而且這些精美的視覺升級也對整體性能造成了相應降低。

同樣的情況發生在,添加超品質 RT 效果後,RTX 4090 從 84fps 降至 58fps,RTX 3090 Ti 從 70fps 降至 39fps。較新的 GPU 減少了 31%,較舊的 GPU 減少了 44%。

我不會說 Nvidia 已經完全破解了光線追踪技術——我們必須等待更實惠的 RTX 40 卡來看看這是否屬實——但他們在降低 FPS 成本方面的成功令人鼓舞。

我希望所謂的 DLSS 改進也能給我留下同樣的印象,但奇怪的是,RTX 4090 實際上似乎與 DLSS 2.0、2.3 和 2.4 等舊版本缺乏親和力。一些測試仍然產生了良好的結果,例如:在 DLSS 處於最高“質量”設置的情況下,我可以打開 Ultra 光線追踪,並且仍然獲得比無 RT 原生 4K 更快的 137 fps 平均速度。但有幾次,升級帶來的收益卻出乎意料地微乎其微。 《地鐵:離去》在啟用光線追踪的情況下,在混合了 DLSS 的情況下每秒僅獲得一個糟糕的幀,並且的 DLSS 質量設置僅產生 8 fps 的提升,最高可達 135 fps。添加 Quality DLSS 後,光線追踪《看門狗:軍團》中的 58 fps 也略有上升,達到 63 fps。在所有三種情況下,DLSS 在 RTX 3090 Ti 上都取得了相應更高的 FPS 增益。

當相同的遊戲在原始分辨率下運行速度大大加快時,這就不是什麼問題了,這給了它們足夠的領先優勢,即使有升級的能力,RTX 3090 Ti也無法趕上。正如我們很快就會看到的,DLSS 3 的工作效果也好得多,而且在 RTX 40 系列之外的任何 GPU 上都無法實現這一點。不過,我想知道 DLSS 較低的渲染需求(加上 GPU 已經令人生畏的實力)是否可能會讓 Core i5-11600K 無法處理——即使這不是 RTX 4090 的錯,但被專注於遊戲、通常功能強大、推出僅兩年的 CPU 所帶來的瓶頸並不理想。

Nvidia GeForce RTX 4090 評測:1440p 性能

將分辨率降低至 2560x1440 會帶來另一個性能異常。 1440p 並不完全是 RTX 4090 五年後的目標,但為什麼有時會這樣慢點在此分辨率下比 RTX 3090 Ti 更好? 163 幀/秒極限競速:地平線 4不僅比 4K 時快了 4 fps,而且比使用相同 Ultra 設置管理的 RTX 3090 Ti 慢了 16 fps。 《最終幻想 15》也表現不佳,在普通 Highets 設置下平均幀率為 111 fps,在啟用所有額外 Nvidia 設置後平均幀率為 84 fps。這分別落後 RTX 3090 Ti 9 fps 和 3 fps,這兩個結果僅比 4K 時高 3-4 fps。

88fps看門狗軍團, 115fps地鐵:離去,以及 177fps殺手3,RTX 4090 在 1440p 的分辨率下繼續低於 RTX 3090 Ti。其幀速率為 147fps地平線零之曙光也僅以看不見的 5fps 擊敗了上一代 GPU,結果為 136fps全面戰爭:三個王國'Battle 基準測試僅領先 16 fps。從技術上來說,這仍然是一個進步,但與 RTX 4090 在 4K 下提供的 40fps 增益相比沒有什麼可比的。

在我測試的所有遊戲中,只有兩款 -古墓麗影之影刺客信條瓦爾哈拉– 1440p 性能確實有了很大提升。其中包括具有超品質光線追踪功能的 SoTR:通過與 SMAA x1 配合使用,RTX 4090 的 145 fps 輕鬆超過 RTX 3090 Ti 的 128 fps。在《刺客信條:英靈殿》中,超高預設下的 1440p 允許 RTX 4090 達到 130fps 的平均幀率。在 144Hz 顯示器上,這看起來比 RTX 3090 Ti 的 103fps 更流暢。

但這並不能彌補 RTX 4090 在其他地方與 1440p 的掙扎。我嘗試過重新啟動、重新安裝、驗證緩存、測量熱量、監控電源使用情況等,以確定這是否是一個徹底的技術問題,但都無濟於事。這使得 CPU 瓶頸成為最可能的原因,但如果這是決定因素,為什麼 RTX 3090 Ti 有時會在同一個 Core i5-11600K 上轉移更多幀?

(旁注:RTX 4090 確實需要大量電力,但至少在這款 Zotac 型號上,能源使用不會導致過熱。在基準測試期間,GPU 溫度通常保持在 50°c 到 60°c 之間,在 70°c 處有幾個非常短暫的峰值。)

Nvidia GeForce RTX 4090 評測:DLSS 3

拋開謎團不談,還有什麼可以這張卡的 DLSS 3 支持讓它更有吸引力。我打算在未來為此編寫一份更詳細的指南,因為目前它僅在少數軟件中進行了測試,但我在《賽博朋克 2077》中看到的 DLSS 3 非常令人信服。

DLSS 3 的工作原理如下:除了以較低分辨率渲染幀然後對其進行升級(就像舊版 DLSS 版本增強性能一樣)之外,DLSS 3 還讓顯卡在傳統渲染幀之間插入全新的 AI 生成幀。這些新幀——生成的、插值的、假的,無論你想怎麼稱呼它們——仍然受到 DLSS 所包含的基於人工智能的出色抗鋸齒功能的影響,並為升級過程本身提供了更大的 FPS 提升。

這是多麼大的推動啊。在 4K 分辨率、最高高/超高設置和心理品質光線追踪下運行時,《賽博朋克 2077》在 RTX 4090 上的平均幀率僅為 39 fps,沒有任何升級。但使用 DLSS 3,在最高質量設置和啟用幀生成的情況下,速度可達 99fps。速度提高了 153%,並且通過將 DLSS 3 的升級質量降低到性能模式,它變成了223%改進。那真是不可思議的事情。在將《賽博朋克 2077》更新為支持 DLSS 3 的版本之前,我還嘗試過老式的 DLSS 2.4,並在質量模式下獲得了 67 fps - 不錯,但在 DLSS 3 上沒有任何效果,特別是如果您有更快的顯示器可以利用。

“假”框架通常看起來也非常準確。我對 AI 藝術的主要體驗是在 Twitter 上滾動瀏覽解剖學上令人厭惡的 JPG,但 DLSS 3 在從周圍的“真實”幀中繪製數據以生成自己的數據方面做得相當不錯。這是我錄製的《賽博朋克 2077》片段中的一個假幀,以及緊隨其後的傳統渲染幀:

3840x2160,高紋理,Psycho RT,DLSS 3 質量,AI 生成的幀
3840x2160,高紋理,Psycho RT,DLSS 3 質量,渲染幀

玩找茬遊戲遇到困難嗎?這是使用 Nvidia ICAT 放大的圖像:

左:生成的幀。右:渲染幀

是的,這個人工智能生成的場景中唯一的問題是偶爾出現一些糊狀的用戶界面。需要強調的是,當沒有突然的變化或鏡頭切換時,這種微小的缺陷是最糟糕的。大多數假幀看起來更像真實的幀,並且由於每秒出現如此多的幀,因此在遊戲運行時基本上不可能發現這樣的微小差異。

天哪,很難發現那裡的情況差異很大。幀生成的弱點是突然的轉變:當屏幕上的圖像與前一幀完全不同時。例如,這個生成的幀是在我更改行車攝像頭位置後立即生成的:

3840x2160,高紋理,Psycho RT,DLSS 3 質量,AI 生成的幀

更糟糕的是,對吧?由於缺乏附近看起來相似的幀的數據,該算法變得相當混亂。但同樣,這只是每秒幾十幀中的一幀,DLSS 3 在分析一幀傳統渲染的幀後很快就能快速自我糾正。結果是,這種模糊的混亂變得像小的 UI 問題一樣幾乎看不見。當我錄製該幀時,我一直在積極尋找這種確切的缺陷,而且它過得如此之快,以至於我直到稍後觀看並暫停鏡頭才注意到它。老實說,沒關係。

存在一個實際缺點,即幀生成會比“標準”DLSS 造成更高的輸入延遲增加。你也不感覺AI添加的幀在控制流暢度方面——這純粹是視覺升級——所以我看不出它會受到緊張的射手的歡迎。 100 fps 以上的賽博朋克看起來確實很宏偉,但對我來說,瞄準和駕駛感覺更接近 60 fps 的感覺。

不過,我不認為這對 DLSS 3 來說是一個毀滅性的問題。像《反恐精英》、《Valorants》和《Apex Legendses》這樣的遊戲都是為了在低端 GPU 上流暢運行而設計的,所以像 RTX 4090 這樣的遊戲就可以提供足夠多的幀,而無需首先進行升級。每款支持 DLSS 3 的遊戲都內置了 Nvidia Reflex,其全部目的是減少系統延遲 - 因此至少可以控制延遲。對我來說,《賽博朋克》感覺足夠流暢 - 感覺 60fps 左右的鼠標和鍵盤控制幾乎不會遲緩,並且請記住,其他要求不高的遊戲會產生更多“真實”幀,因此看起來會更流暢。

總的來說,這對於 DLSS 3 來說是一個良好的開端,任何記得 DLSS 1.0 的人都知道,未來性能和清晰度會得到進一步的改進。事實上,這是一個足夠引人注目的功能,它本身就可以使 RTX 40 GPU 看起來像是一項更合理的投資。到目前為止,只有幾十款遊戲被確認支持它,但這個數字肯定會增加,就像 DLSS 最初推出時只有幾款兼容遊戲,後來發展到超過 200 款遊戲一樣。

具體到RTX 4090,我至少能明白它的意義。我無法對 RTX 3090 Ti 做同樣的事情:當該 GPU 推出時,它比 RTX 3090 貴得多,儘管只是稍微快一點。儘管 RTX 4090 對您的財務提出了更高的要求,但它也是一款明顯更好的 4K 卡,在最高質量光柵化性能上經常超過 100 fps,在光線追踪下超過 60 fps。添加 DLSS 3,它是 RTX 3090 Ti 從未有過的真正令人印象深刻的 PC 征服者。

然而……多少?對於在低於 4K 的分辨率下運行時感到困惑和不安的 GPU,並且似乎在舊的 DLSS 版本上遇到問題,除非它與類似的前沿 CPU 配對?可能有一小部分核心發燒友不惜一切代價渴望獲得最佳性能,但對於其他人來說,RTX 4090 的入門障礙將使其排除在認真的升級選擇之外。

不過,對於我那些大窮人來說,一切都還沒有結束。這裡最吸引人的東西顯然是 DLSS 3,儘管目前它是 RTX 4090 和兩個 RTX 4080 變體的保留,但更實惠的 RTX 40 GPU 肯定即將推出。給它幾個月的時間,你應該能夠享受 RTX 4090 架構的最好部分,而無需賣掉你的骨髓來買得起它。