技术泄密者 kopite7kimi 指出,早在 2021 年 6 月贴出Nvidia T234处理器的详细图片,首次透露任天堂将收到一款名为 T239 的定制版本。在接下来的两年里,大量压倒性的证据基本上证实了他们是正确的。 T239 是一款先进的移动处理器,基于八核 ARM A78C CPU 集群,搭配基于 Nvidia RTX 30 系列 Ampere 架构的定制图形单元,结合最新 Ada Lovelace GPU 的一些反向移植元素 - 以及全新文件解压引擎,快速引擎。它还支持 Nvidia 的控制台特定图形 API,这几乎证实了它注定是为。
在这篇文章中,我们将讨论将 T239 与任天堂联系起来的各种证据,我们还将研究图形领域中最接近的等效移动 GPU,将其降频至超低频率,以尝试获得某种方式处理基于安培的低功耗图形核心可以提供什么,光线追踪是否可能,以及 DLSS 升级对于第二代任天堂混合手持/控制台有多重要。我们还将看看我们的分析是否与从来选择开发商。
但让我们从一个基本的问题开始。我们是否可以百分百肯定地说 T239 确实是 Switch 2 芯片?这是负面的。然而,我们绝对可以将 T239 与任天堂项目联系起来,并且没有证据 - 事实上也没有必要 - Nvidia 为其他任何人创建这款芯片。为了在汽车和机器人市场上做出自己的努力,该公司已经拥有了 T234。要了解定制变体,最好先了解 T234 是什么以及为什么任天堂一开始就不能使用该芯片。
毕竟,回到第一代 Switch,根本不涉及定制处理器。尽管在宣布任天堂混合版时 Nvidia 进行了营销暗示,但该机器的核心芯片是普通的 Tegra X1,尽管禁用了一些元素(例如其较低核心的 CPU 核心)。 Tegra X1 从一开始就为平板电脑、手机和游戏市场而设计,一直很失败,直到任天堂将其用于 Switch,并在 Switch 上找到了新的生命力。对于 Switch 2,Nvidia 的零件箱中没有任何适合后续产品的产品。最新的 Tegra 处理器(例如 T234)专为完全不同、要求更高的市场而打造。优秀的移动芯片的构建模块已经存在,但现有的配置对于精简的主流控制台来说太大且臃肿。
让我们明确一点:现有的 T234 是一个巨大的芯片。模具尺寸为455mm2,它使 Xbox Series X 处理器相形见绌,为 360mm2。它采用与 RTX 30 系列卡相同的三星 8 纳米技术制造,因此它实际上比当前游戏机中使用的 7 纳米和 6 纳米工艺落后了一步。 CPU大小,具有12个ARM A78AE CPU核心,搭配基于30系列Ampere架构的GPU,具有2048个CUDA核心和256位内存接口。对于汽车和机器人市场,T234 需要大量的机器学习性能,因此还内置了深度学习加速器 - 并且其功能可以通过 GPU 内的张量核心来增强。
Nvidia 的 T239 - 下一代游戏处理器
显而易见的是,T234 太大了,无法在移动产品中使用。 455毫米处2,这个处理器比392mm大很多2RTX 3070,结合常识推理、泄密、Nvidia 重大黑客事件以及 Nvidia 和前 Nvidia 员工的不当 LinkedIn 帖子,我们对 T239 的形式有了很好的了解。同样重要的是,Nvidia 维护着自己的 Linux 发行版,虽然其中大部分是私有的,但其中有足够的 T239 参考资料,可以帮助您了解处理器的构成。
首先,CPU 集群与 T234 的有很大不同。虽然 A78 ARM 核心很常见,但 AE 变体是为了满足汽车电子委员会制定的严格标准而构建的,其中一半核心用于验证另一半核心的工作 - 完全不适合游戏机。 Nvidia 的 Linux 发行版表明 T239 在单个集群中有 8 个 CPU 核心,强烈表明将使用 ARM 的 A78C。
英伟达T234 | 预计T239 | 英伟达 RTX 2050 4GB | |
---|---|---|---|
CPU架构 | 12 个 ARM A78AE | 8x ARM A78C | - |
GPU架构 | 安培 | 安培 | 安培 |
CUDA 颜色 | 2048 | 1536 | 2048 |
内存/接口 | 256 位/LPDDR5 | 128 位/LPDDR5 | 64 位/GDDR6 |
内存带宽 | 204GB/秒 | 最大 102GB/秒 | 96GB/秒 |
内存带宽对于移动游戏机至关重要,也是当前 Switch 的主要性能瓶颈。 T239 中的 256 位接口对于移动游戏机来说非常奢侈,而 Nvidia 的 Linux 更新建议采用 128 位接口,几乎肯定会与 LPDDR5 内存搭配使用。我们预计绝对最大带宽为 102GB/s,但当然,任天堂可以选择降频以提高效率。 T239 中支持 DisplayPort(可轻松配置为 HDMI),就像标准 Switch 中一样。这里的区别在于,假设任天堂使用 HDMI 2.1,则有足够的带宽来支持完整的 HDMI 2.1。
来自 Nvidia Linux 发行版的其他规格泄露也很有趣。 T239 上有一个完整的媒体编码/解码块,尽管该芯片使用 RTX 30 系列 Ampere 架构,但该媒体块是从最新的 Ada Lovelace 芯片反向移植的,因此它应该更快,支持更多格式,包括 AV1。改进的时钟门控(一种提高休眠硅效率的方法)是 T239 中的另一项 Ada 功能。在讨论该芯片时,功耗是一个有点棘手的问题,出于多种原因,我将很快解决。
Nvidia 的 Linux 发行版还确认 T239 具有光流加速器 - DLSS 3 帧生成的核心组件。这里的问题是,这是最后一代 Ampere 演绎版,而不是 Nvidia 认为足以实现帧生成的 Ada Lovelace 演绎版。它是否会在潜在的 Switch 继任者中发挥作用还有待观察,但有趣的是,当 Nvidia 构建这款定制、精简版 Tegra 时,该模块被保留下来。
T239 还有一个值得评论的组件 - FDE。这是 T234 中没有的全新硬件模块。 FDE 代表文件解压缩引擎。与 PlayStation 5 中的解压块类似,这基本上允许将资产从存储超快速解压到内存中。 Nate The Hate 最近发表了一篇报道,谈到在 Switch 2 硬件上运行的《荒野之息》演示,加载时间为零。嗯,T239 拥有促进超快速加载的硬件,但它需要更快的存储格式才能实现这一点 - 目前我们还缺乏细节。
Linux 细节描绘了 T239 的非常详细的图景,其中许多细节都得到了 Nvidia 黑客的证实 - Ampere GPU 架构、128 位内存总线和 LPDDR5 内存,以及 Ada Lovelace 设计中向后移植的节能功能。黑客攻击还表明,T239 拥有 1536 个 CUDA 核心,是规模大得多的 T234 核心的 75%。
我们现在拥有一款经过大幅精简的 Tegra 芯片,删除了冗余功能并添加了文件解压缩块。但还有一些问号。我们期望 CPU 和 GPU 的时钟速度是多少?内存运行速度有多快?这是理解移动处理器性能限制的关键问题。还有一个问题是T239是否具有T234的深度学习加速器。我相信这对于潜在的 Switch 2 及其 DLSS 升级的使用至关重要。
关于时钟问题,Nvidia 提供了一个计算 T234 功耗的工具,它表明 GPU 在 540MHz 时效率最高,这是手持时钟的良好候选者。时钟速度越快,效率就会急剧下降,并且需要的功率越大,产生的热量就越多。如果对接时钟超过 1GHz,我会感到惊讶,而且它可能会低很多。 1.0GHz 看起来也是 CPU 时钟的最佳选择。然而,这些是针对更大的 Tegra 芯片的计算,该芯片肯定采用 8nm 三星工艺。更小的芯片可能会更高效,但目前没有证据表明它仍然采用低效的三星 8nm 工艺(尽管我怀疑是这样)。
T239会有怎样的表现呢?
所以,总而言之,到目前为止,我们已经对一款名为 T239 的芯片的规格有了详细的了解,该芯片已经开发了几年,该芯片在两年多前首次被泄露,此后在 Nvidia 的 Linux 发行版中多次被引用,在 Nvidia 黑客事件以及 Nvidia 员工在 LinkedIn 上的几篇帖子中都提到了这一点。但还有更多:如果你愿意的话,这是确凿的证据。当最初的 Switch 开发出来时,Nvidia 创建了一个低级图形 API,以充分利用 CPU 和 GPU 硬件。它被称为 NVM。 Nvidia hack 描述了一个 NVN2 图形 API。它表明多个 Nvidia 硬件可以与 NVN2 一起使用,但有几个代码段明确表明它正在其他硬件上模拟 T239 行为。简而言之,Nvidia 重构了现有的 Tegra,使其更小、更高效,并配备了快速加载硬件 - 并且它使用了 Switch NVN 图形 API 的下一代版本。
那么,对于一款手游机来说,T239应该有什么期待呢?在最近的微软 FTC 法庭案件中,动视暴雪提到任天堂去年向他介绍了该设备,其性能概况与上一代硬件一致。嗯,情况很可能是这样,但我们同样可以说 Switch 的马力与 Wii U 或 Xbox 360 相似,但重量却远超这个重量。首先,这是通过更现代的 GPU 和更多内存实现的。我冒昧地建议 Switch 2 遵循这一趋势 - 并且走得更远。我的意思是,Bobby Kotick 谈论 PS4 级性能,但与此同时,我们听到有关在虚幻引擎 5 上运行《黑客帝国:觉醒》的讨论,这是 PS4 永远无法做到的。当您拥有基于更现代的 GPU 的定制芯片,并配备机器学习张量核心和硬件加速光线追踪时,就会发生这种情况。
为了了解移动安培级处理器的功能,我开始进行一些实际工作。在 PC 领域,A78C CPU 集群的功能没有真正的同等功能,但在 GPU 方面,我们可以接近。我购买的戴尔 Vostro 5630 配备以下规格:Core i7 1360p CPU、16 GB 4800MHz LPDDR5、512GB SSD 和 RTX 2050。这是我们在这里更仔细研究的最后一个组件。
首先,尽管它被指定为 RTX 20 系列部件,但它实际上与基于 Ampere 的 RTX 3050 和 3050 Ti 完全相同的芯片 - 它是 GA107 处理器。我们无法与 T239 的 1536 个 CUDA 核心相匹配,但 2048 个 CUDA 核心是我们可以在 Ampere 游戏 GPU 上使用的最低配置。那么为什么不直接购买一台 3050 笔记本电脑呢?嗯,可以将 2050 想象为脑白质切除的 3050 - 它具有较低的功耗预算、较低的时钟频率,而且最重要的是,它具有 64 位内存接口。与 RTX 3050 相比,它的带宽为 96GB/s,运行时存在相当大的瓶颈,但它也让我们与潜在的 Switch 2 可以提供的带宽大致相当。但有一个症结所在 - 2050 仅配备 4GB 内存。我预计 Switch 2 的系统总内存将达到 8GB 甚至 12GB。
您将在本页顶部的视频中看到我的测试结果,但在继续之前,让我们先明确一下:这是我们可以为 T239 GPU 收集到的最接近的近似值,但更准确地说,您在该视频是一个超低规格的 Ampere GPU,以极低的时钟速度运行,缺乏内存带宽。它只能让我们对移动 Ampere 芯片的性能有一个大概的了解,即使我将其降频到低得离谱的 750MHz,但即便如此,结果仍然很有趣。
由于 RTX 2050 的 4GB 内存限制,我无法运行《黑客帝国:觉醒》,而且该演示版似乎至少需要 5.6GB 左右。然而,完全启用使用 Lumen、Nanite 和虚拟阴影贴图的 UE5 体验确实有效。事实上,与控制台版本不同,我们实际上可以在 PC 版本中使用硬件加速光线追踪,并且它确实可以在 RTX 2050 笔记本电脑上运行。我测试了硬件 RT Lumen 及其软件变体,还测试了原生 720p 和几个 DLSS 变体,全部解析为 1080p 输出。根据记录,具有 DLSS 性能模式(540p 输入,1080p 输出)的软件 RT 是获胜者,但最好和最差结果之间只有 9.5% 的差异,而以 fps 计算,仅为 2.82fps。
我的猜测是,基于目标硬件的 Switch 2 的《黑客帝国:觉醒》演示可能是真实的,但 Epic 一定做了很多工作,让虚幻引擎 5 的关键功能在新的任天堂机器上运行良好,仅仅因为《黑客帝国:觉醒》是一款GPU 上的负载比 Fortnite 重很多。既然如此,仅仅在低功耗 Ampere GPU 上运行 PC 代码不太可能有那么明显的信息。尽管如此,它确实运行了。您可以使用硬件 RT。 DLSS 很有帮助。
我也尝试过,对 GPU 密集型介绍进行基准测试。在 1080p 原生分辨率下,该序列的平均帧率为 34.9 fps,这确实支持了上一代马力的叙述。在 720p 下,帧速率升至 52.5fps。我也在 DLSS 质量模式下运行了这个工作台 - 原生分辨率的 67%。平均 34.9 fps 增加至 44.7 fps。在使用 DLSS 的 720p 下,帧速率确实有所增加,但性能差异很难准确测量,因为序列实际上上限为 60fps。尽管如此,从游戏玩法来看,DLSS 性能模式下的 1440p 在这款基于 Ampere 的小型 GPU 上是可行的,虽然游戏的大部分内容都锁定在每秒 30 帧,但还是有一些下降。在与BT的对抗中,繁重的后处理似乎让GPU难以应对。
DLSS 支持:对 Switch 2 有用还是绝对重要?
我相信 DLSS 对于下一代任天堂机器至关重要,但我们能否获得传说中的“Switch 4K”取决于原始 T234 的核心组件是否已进入 T239。我指的是深度学习加速器 - 一个单独的硬件模块,可以将其自身的处理与 GPU 内的张量核心结合起来。我对 RTX 2050 的测试表明,DLSS 对于升级到 1080p 甚至 1440p 很有用,正如我们在《死亡搁浅》中看到的那样。然而,输出分辨率越高,DLSS 的成本就越高。在《死亡搁浅》中,将 720p 升级到 4K(DLSS 超性能模式)的额外成本超过 18 毫秒。对于 60fps 演示,仅 DLSS 的处理成本就超过了整个帧的 16.7ms 渲染时间。然而,如果 DLA 从 T234 发展到 T239,DLSS 的计算成本将会少得多。
强调 DLSS 对于整个 Switch 2 企业的重要性也很重要。正如您将在视频中看到的,我们所有的游戏测试都产生了一些相对令人印象深刻的结果 - 但都需要使用 DLSS,从各种内部分辨率升级到 1080p。因此,在 PC 领域,通常认为在 4K 性能模式、1440p 平衡模式和 1080p 质量模式下运行升频器是“可以的”。客厅里的游戏机游戏是不同的,你坐在离屏幕更远的地方,图像质量的期望也不同。毕竟,我们已经在这一代中看到了一些非常低的分辨率,甚至从 PS5 和 Series X 开始也是如此。
因此,我实际上认为,对于连接到客厅显示器的移动芯片组,从原生 540p 升级到 1080p 性能模式看起来是可以接受的,而从原生 720p(DLSS 质量模式)升级到 1080p 看起来相当不错。它看起来肯定比我们在对接游戏中看到的大多数要求苛刻的 Switch 游戏要好得多。 DLSS 4K 超性能模式从原生 720p 升级?再次查看上面的视频 - 它远非原始 4K,但低功耗控制台不需要模仿原生 4K。它只需要在 4K 客厅电视上提供像样的图像即可。
这基本上就是我现在对 Switch 2 的了解、它的技术构成以及超精简的 Ampere GPU 可以提供的大概性能。仍然存在争议和许多悬而未决的问题。有些人认为 T239 是为废弃的“Switch 4K”或“Switch Pro”设计的,而实际的下一代 Switch 将提供不同的东西。我不同意这一点:制造 T239 所需的投资水平以及 GPU 及其定制块的大小代表了对 Tegra X1 的适当的下一代飞跃。
问题和疑虑:T239 是否适用于手持设备?
然而,对于 T239 存在一些更合理的问题和担忧。我们已经确定 455mm2T234 对于移动游戏处理器来说太大了 - 但即使在 CPU 和图形方面进行了各种削减,T239 也可能比 118mm 大得多2当前 Switch 中的 Tegra X1。更大的芯片需要更强的冷却能力,这可能不太适合任天堂混合手持/家用游戏机。一些人认为 T239 根本不在 8nm 三星工艺节点上,很可能只有拆解零售机器才能以某种方式证实这一点。
从我的角度来看,最重要的是,通过淘汰过程,T239 是新任天堂机器核心处理器的最佳候选者。 Nvidia 的 Jensen Huang 公开表示英伟达与任天堂的合作关系可能会持续二十年。由于发布日期定在 2024 年,目前还没有任何其他处理器可以进入新 Switch 的令人信服的消息。
我很高兴将这些实际测试与 RTX 2050 结合起来,它让您了解基于安培的最低 GPU 可以提供什么。假设您相应地调整设置,任何现代游戏似乎都可以很好地运行。 DLSS 再次成为游戏规则的改变者,如果深度学习加速器模块存在的话,它可能会更具变革性。
但请让我再强调一次,这只是我们可以对所讨论的 T239 规范做出的最接近的近似值:虽然时钟较低,但 CUDA 核心较高。虽然内存带宽在 PC 方面微不足道,但它与 T239 所能提供的最好的内存带宽差不多——任天堂可能会选择降频。当然,在我们的测试中,CPU 的带宽没有争用——另一个潜在的性能消耗。
即便如此,这里还是有希望的 - 请记住,我使用的是我测试的游戏的 PC 版本,没有针对移动平台的定制空间。事实上,魔力将来自开发人员本身。回顾一下《毁灭战士 2016》首次登陆 Switch 的时间,或者,或重制版,或者由 Rebellion North 制作的令人惊叹的移植版,例如《狙击精英》和《僵尸军团》游戏。这些游戏挑战了 Tegra X1 的技术限制,无论 T239 的规格如何,我希望下次也能看到同样的情况。
开关 2:我们无法回答的大问题
一旦我们看到硬件,我们关于下一代 Switch 的一些悬而未决的问题可能会得到一些答案。有多大?承诺的电池寿命是多少?比赛会是什么样子?现有的 Switch 硬件(包括 JoyCon)可以在多大程度上与其后继产品兼容?我们还可能从英伟达本身那里得到一些关于它在机器开发中所扮演的角色的进一步披露。
根据我这几个月来对 T239 的了解,我认为我最大的惊喜是它的硬件是多么雄心勃勃。如果有机会重新架构一个新的、以游戏为中心的处理器,Nvidia 可以遵循其 GTX 16 系列显卡所制定的路线,剥离机器学习和 RT 硬件,或者通过削减将它们削减到最低限度。 -价格替代方案(例如 AMD 将硬件 RT 集成到 RDNA 2 中的方式,重点是尽可能降低硅成本)。相反,证据表明 Nvidia 和任天堂已经就一种设计达成了一致,该设计可以说是超额交付了下一代功能,而文件解压缩引擎 (FDE) 则表明了硅片的生活质量增加,坚定地围绕着伟大的游戏经验。这会是继GameCube之后任天堂最具前瞻性的硬件设计吗?
虽然关于使用三星 8nm 芯片的问题仍然存在,但任天堂公司有一线希望,可以进一步推出改进的模型。它可以采用 6nm、5nm 或 4nm 技术来改善散热和电池寿命,就像改进后的 Switch、OLED 型号和 Switch Lite 一样。从短期来看,问题是 T239 将有多大,以及它的特性是否意味着我们需要更大的手持设备 - 我认为任天堂不会想要这样的东西。
目前,各种泄密和非官方披露意味着我们对下一代任天堂机器的内部结构的了解可能比对其他更重要元素的了解要多得多 - 例如新硬件的整个概念。 T239 是一款面向移动设备的处理器,而任天堂将所有开发资源集中到一个平台,这意味着我们几乎肯定会关注另一款 Switch,而不是某种全新的概念。然而,从任天堂的历史来看,直接的 Switch 2 似乎太简单了 - 但随着最初的披露希望不会太远,希望我们很快就能对新机器有更好的了解。