在Alchemist核心的英特尔Arc锐炫独显面世两年之后,新一代基于Battlemage核心的英特尔独立显卡今日也正式公布。和Alchemist核心相比,全新的Battlemage核心不但采用了更新的Xe2微架构,而且在性能、执行效率以及能耗比等方面相比Alchemist核心都有明显的提升,同时Intel XeSS等软件功能也伴随新核心显卡的推出得到了进化。今天,就让我们一起先睹为快,了解一下Battlemage核心的新一代英特尔锐炫独显。
随着AI计算的兴起,GPU已经成为全球最重要的半导体产品之一。作为AI计算的技术基座,GPU得到了AMD、英伟达和英特尔在内的企业的重视。作为大规模独立GPU的后来者,英特尔之前发布基于Xe架构和Alchemist核心的ARC A系列GPU在市场上也得到了不错的反馈。在ARC A系列产品上市2年后,根据之前的路线图,英特尔又发布了Xe 2架构的、基于Battlemage核心的新一代ARC B系列产品。
首发产品包括ARC B580和ARC B570两款,定位中高端市场,提供了比前代产品更出色的游戏性能、光线追踪性能、AI性能以及XeSS 2、XeLL等新功能,同时带来了更好的驱动适配、软件易用性等。由于本次新产品更新内容众多、技术升级显著,受制于速度和篇幅,我们在《微型计算机》正刊中会更为详细地予以介绍。在本文中,我们会快速而明确地帮大家对新的产品和技术建立概念,予以直接解读。
2K游戏时代来临:英特尔ARC B系列GPU正式发布英特尔的独立大规模GPU芯片在发布后还是得到了部分消费者的青睐,其ARC A系列GPU产品被广泛用于制造独立显卡、应用在笔记本电脑市场,甚至作为掌机的图形性能来源。经过2年的发展,ARC系列GPU成长为市面上继英伟达和AMD之后的第三股力量。
新的B系列GPU正是基于A系列GPU的市场优势而来,主要带来了三大方向的改进,一是全面加强的新一代游戏功能,比如更深入利用了AI计算的XeSS 2。二是带来了最好的单位价格性能,在性价比方面B系列GPU相比竞争对手产品都更有优势。三是结合英特尔在AI加速方面的技术积累,B系列GPU的XMX模块架构得以进化,AI算力和效能都得到了提升。
对广受关注的游戏市场而言,英特尔认为目前游戏市场发生了三个方面的变化,一方面是更逼真的光照效果,比如全景光线追踪、多次反射、材质反射等技术的应用,使得游戏画面的光影效果更为真实。第二个方面是更多细节的图形,比如UE5引擎的广泛使用,带来了细节更多、内容更丰富的游戏图形和娱乐体验。第三个方面则是整体游戏市场,玩家使用的显示器的分辨率在不断提升,2024年,使用2K分辨率也就是2560×1440显示器的游戏玩家已经提升至整个显示器市场的22%,相对应地留在1080p分辨率的用户正在逐渐减少。
因此,英特尔的新一代B系列GPU,通过更新架构、扩大规模、提升性能,在带来了三方面的改进的同时,也通过顺应当前市场的发展和变化,为游戏玩家提供符合技术趋势和游戏演进的GPU产品。
全方位更新的Xe 2架构:更丰富的资源、更强悍的性能表现新的ARC B系列GPU的最大变化在于采用了新的Xe 2架构。
Xe 2架构相比前代的Xe架构,主要的改变在于整体拥有更高的架构利用率、内部工作分配机制进行了优化,同时还降低了软件部分的开销。
英特尔给出了一个Xe 2渲染片的架构图。一个完整的Xe 2渲染片,由4个Xe 2核心组成。英特尔提到了多方面的改进,包括但不限于:Xe 2核心的整体性能显著提升,光线追踪单元的性能显著提升,几何单元和像素单元的能力都大幅度加强。在计算能力方面,Xe 2目前可以执行SIMD 16计算之外,还可以执行SIMD 32的计算。针对AI计算,Xe2还可以执行TF32指令。此外,整个Xe 2渲染片的后端也有大幅度改进,比如采样执行吞吐量翻倍、Z轴消除的能力提升50%等。
Xe 2渲染片目前使用的是第二代Xe核心。新的Xe核心带来了8个512bit的矢量单元,8个2048bit的XMX单元,64bit的atomic ops操作以及256KB的共享L1缓存以及SLM支持等。深入每个矢量单元的话,可以看到原生SIMD 16的支持以及不再分组、更大的FP和INT、EM以及FP64单元等。相比之前第一代Xe核心中分为2组的计算模块,第二代Xe核心的计算模块更大、一次吞吐能力更强。
光线追踪方面相对来说,Xe 2给了更多的资源,比如3倍的traversal pipeline、18个Box intersections,2个Triangle intersections以及16KB的BVH缓存,这些数据分别是上代产品的1.5倍、1.5倍、2倍、2倍,资源显然更为丰富。
英特尔还展示了一个完整的BMG-G21的芯片图,可以看到包含了5个完整的渲染片,拥有20个第二代Xe核心、160个XMX单元、20个光线追踪单元、20个纹理单元、10个后端像素单元、18MB的L2缓存以及192bit GDDR6支持等内容。
英特尔数据显示,Xe 2的引入,带来了相比前代产品70%的性能提升和50%的每瓦特性能提升,提升幅度不可谓不大。
性能方面,英特尔也给出了一些展示。在多种类型的测试中,Xe 2的GPU最多带来了12.5倍性能提升,最少也有1.2倍(曲面细分)。
另外在整体游戏提升方面,英特尔以1440p也就是2K分辨率下1帧画面的渲染时间为例,可以看出B580对比A750,从一开始的渲染本地数据的预传递到执行、计算、体积雾、照明等,全部都带来了更少的计算时间以及更优秀的性能表现,最终差距极为明显,B580只耗费了A750的68%,显示出卓越的性能表现。
XeSS 2和XeLL:英特尔加入帧生成技术并大幅度降低游戏延迟除了上述内容外,英特尔本次还带来了新的XeSS,被称为XeSS 2。
XeSS 2的首个突破在于可以在光线追踪游戏中使用了。这意味着英特尔针对光线追踪进行了XeSS在AI模型上的重大改进。性能方面,英特尔给出的数据显示,XeSS 2带来了平均47%的帧率提升,表现不错。
除了应用范围大幅度拓展外,英特尔还首次为XeSS 2加入了XeSS帧生成技术,大幅度提高了游戏的流畅性。XeSS 2的帧生成技术,主要是在第一帧和第二帧之间,插入新的AI计算的帧,计算的主要原理是光流重投影和运动矢量重投影,新的插入帧大幅度提升了画面的流畅度。
英特尔数据显示,XeSS 2帧生成技术在质量模式下,可以带来至少2.8倍的性能提升,如果是超级性能模式,更是可以带来3.9倍性能提升,极大地改善了游戏的流畅性。
在游戏延迟降低方面,新一代GPU支持XeLL技术可以拥有更低的延迟。英特尔给出的案例显示,XeLL能够降低CPU等待队列延迟、显示延迟等,带来了整体延迟的降低。英特尔还提供了工具来测试延迟降低的情况,测试显示XeLL最多带来了45%的延迟降低,这对激烈的FPS游戏来说是极有帮助的。
AI性能大提升,驱动软件更好用在前文我们提到过Xe 2架构在XMX以及AI相关单元方面的改进。
英特尔给出了具体的数据,作为对比的是RTX 4060,新的ARC B580显卡拥有出色的LLM性能。同时英特尔也在AI相关软件、工作执行流方面进行了充分优化,进一步减少瓶颈效应,提高效率。
在显卡驱动方面,英特尔算是三家独立显卡厂商中更新整个驱动模块最积极的企业了。英特尔新的驱动界面,带来了包括超频、电压控制、电源控制、显存速率在内的调节和控制功能。
其中电压调节、超频等功能使得玩家不需要借助第三方工具,就能够在相对比较安全的范围内,提升GPU的性能,增强GPU的可玩性。这在很大程度上方便了DIY玩家。
英特尔给出的案例显示,用户可以很轻松地通过增加频率、增加功耗限额等,使得GPU的整体频率从之前的大约2700MHz提升到接近3200MHz,幅度相当惊人了。
ARC B580和ARC B570:中高端市场的有力挑战者英特尔本次发布的ARC B580和B570两款显卡的规格如上,整体来看其定位中端市场,价格方面想必维持了英特尔一贯的优势。《微型计算机》也收到了这两款显卡,正在紧锣密鼓测试中,后期我们还会带来显卡的详细测试文章。
性能方面,英特尔数据显示B580相比RTX 4060整体性能平均快了大约10%。
目前其价格尚未公布,但是显然比RTX 4060更便宜,整体性价比还是很不错的。
目前这两款显卡中,B580会在2024年12月13日上市,美元售价为249美元。B570要晚一点,在2025年1月16日上市,定价更低一些。
英特尔锐炫B580显卡赏析
从包装外观上来看,英特尔锐炫B580的整体风格跟此前的A770、A750还算一脉相承,经典的“英特尔蓝”外盒搭配深黑幽邃的显卡配色具有极高的产品辨识度。
B580仍然是经典的双风扇设计,毕竟对于不到200W的TDP设计而言,双风扇也足以驾驭散热控制了。
锐炫B580显卡在正面开有通风散热槽用于加强散热,注意,从解剖示意图中可以看到它采用的是短PCB设计,整体电路设计十分紧凑。
▲供电部分采用了单8Pin设计,对于200W以下TDP的显卡而言,单8pin供电也是最经济实惠的配置。▲输出接口部分是3DP 1.4a+1 HDMI 2.1的组合好了,我们今天的技术介绍就到这里结束了,大家一定对英特尔新的显卡充满了兴趣吧,到底它相比RTX 4060表现如何呢?不要着急,希望大家期待我们随后的《微型计算机》正刊,我们不但有详细的解读,还有权威的性能测试,值得期待哦!
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。