NVIDIA Ada Lovelace新世代专业绘图卡新生报到,NVIDIA RTX™ 5000 Ada Generation(后简称RTX
5000)同样升级过的CUDA核心、第三代RT核心与第四代Tensor核心,配置更低的250W显卡功耗、32GB GDDR6
ECC內存、各2组支持AV1的编解码引擎、支持虚拟化、Quadro Sync II、RTX
Desktop与企业专属功能,满足不同运算需求的专业用户有着合适的专业绘图卡升级。
规格
GPU构架:NVIDIA Ada Lovelace
CUDA平行处理核心:12800
NVIDIA Tensor核心:400
NVIDIA RT核心:100
单精度性能:65.3 TFLOPS
RT Core性能:151.0 TFLOPS
Tensor性能:1044.4 TFLOPS2
GPU內存:32 GB GDDR6 ECC
內存界面:256-bit
內存频宽:576 GB/s
最大功耗:250 W
绘图总线:PCI Express 4.0 x16
显示连接器:DP 1.4 x4
尺寸:4.4″H x 10.5″L双宽度
外部电源连接器:1x PCIe 12+4 pin
同步输出:支持Quadro Sync II
编解码引擎:2x encode,2x decode(+AV1 encode/decode)
简介
现代专业工作不论是图像输出、AI、3D渲染、VFX、模拟与计算等专业工作任务,都可借助GPU加速来获得更快的运算时间,而且NVIDIA从CUDA通用GPU运算开始,逐步发展Tensor核心与RT核心,并在硬件上叠加诸多便利的开发功能,让3D渲染可达到即时光线追踪,更结合AI运算、机器人模拟、OpenUSD创造Omniverse平台。
先前测过的旗舰NVIDIA RTX 6000 Ada Generation(后简称RTX 6000),有着满血AD102核心48GB GDDR6
ECC內存,但相对的单卡成本与300W功耗,对于一般中小企业、实验室需要升级至Ada世代来说成本稍微高了一些,也因此NVIDIA最近更新RTX 5000、RTX
4500与RTX 4000等Ada Generation新卡,满足各式专业工作者的升级需求。
RTX 5000同样采用AD102核心并缩减至100组SM配置,有着12800 CUDA、400 Tensor、100 RT等核心规格,并配置32GB
GDDR6 ECC內存采用256-bit位宽、內存频宽达576GB/s;而且GPU功耗仅250W需要一个PCIe 16-pin供电或2个PCIe
8-pin转接即可,让大部分专业工作站都能直接更新。
至于NVIDIA RTX专业绘图卡与GeForce
RTX游戏显卡的差异在于,专业绘图卡配置更大的GDDR6视讯內存,并支持內存ECC错误修正码的功能,以及较稳定的运作时脉与较低的功耗设定。
而且NVIDIA
RTX专业绘图卡支持着更多的企业专业应用,像是RTX虚拟工作站(vWS)、2组第五代NVDEC译码引擎与第八代NVENC编码引擎、Mosaic多显示器、RTX桌面管理软件、Quadro
Sync II,以及企业管理工具等。
此外,NVIDIA专业绘图卡主要都由合作伙伴销售,像是丽台科技销售的专业绘图卡产品,享有「三年保固」,保固内提供「到府收送」的服务,并提供「0800-600-206」技术服务专线,能给予企业、客户完整的技术支持与服务;这也是与游戏显卡差异最大的地方。
同时NVIDIA提供专业绘图卡「正式分支/ Studio」与「新功能分支」的驱动分支版本。简单来说,「正式分支/
Studio」提供最佳稳定性与性能,以及ISV认证、较长的生命周期、安全性更新等最稳定的版本;而「新功能分支」则是提供最新的驱动功能、错误修正与操作系统支持。
开箱
RTX
5000专业绘图卡,采用全哑黑方正有形的外观与这代经典的暗金色点缀显卡侧面的曲线,显卡长26.7cm长、2-Slot安装空间、单鼓风扇散热的工作站设计,符合工作站的多卡系统扩充与散热器流的一致性。
不同于RTX 6000的镜面黑风格,RTX
5000全哑黑的外观搭配方正有形的利落线条,以及现在少见的传统鼓风扇散热设计,而显卡侧面的暗金色边框与独特的曲线造型,让专业绘图卡有着与众不同的设计感。
显卡侧面左上角则有着Quadro Sync II的连接界面。而显卡的前方,则有着NVIDIA字样与PCIe 16 pin
12VHPWR供电插座。配件中则提供PCIe 16 pin转2个PCIe 8 pin的转接线,让工作站、服务器升级时不需更换电源供应器。
RTX 5000专业绘图卡提供4个DisplayPort 1.4连接埠,同时配件中则有DP
1.4转HDMI的接头可使用。最高可同时输出4个4K@120Hz或5K@60Hz的专业显示器,当然也可支持2个8K@60Hz的超高分辨率屏幕输出。
NVIDIA Control Center、ECC、Mosaic、RTX Desktop
RTX 5000采用32GB GDDR6 ECC內存,预设上会启用內存ECC功能。若要调整则可在NVIDIA Control
Center找到Change
ECC状态可设定为开或关。毕竟专业工作的运算、模拟都需要花费长时间进行,因此藉由內存的错误修正码ECC,能为工作站提高计算精确度与可靠性。
对于专业工作站的多GPU、多屏幕连接情境下,NVIDIA Control
Center也提供Topology信息,从系统驱动版本、专业绘图卡的4个屏幕输出端口,以及目前正在连接的外接屏幕信息,让用户可以更有效的管理工作站目前使用的GPU与外接屏幕。
NVIDIA
Mosaic多显示器技术,支持最多4个GPU、16个显示器的画面整合,用户可依据使用环境来排列显示器,并整合作为单一桌面使用,并提供屏幕边框校正、投影机重叠等进阶的多屏幕整合功能。
RTX桌面管理软件,则是更强大的桌面视窗排列、管理的工具软件,而且可直接在软件中控制多屏幕内的所有视窗排列,并可将目前的视窗配置储存为Profile,并提供预设的几种GRID分割方式,让多屏幕工作情境可更有效的管理。
而在Control
Center当中也可以调整GPU的使用模式,预设是绘图、运算都会使用的模式,倘若是指做绘图功能也可切换至专注绘图任务的GPU模式。
创作、渲染性能测试
性能评价方面则使用专业领域会参考的SPECviewperf、Blender、Vray与OCTANEBENCH等工具,来测试RTX
5000专业绘图卡的渲染、运算性能,同时也加入DaVinci Resolve 18影音输出测试、Omniverse Creator与Stable
Diffusion等测试。
测试平台
处理器:Intel Core i9-14900K
主板:ASUS ROG MAXIMUS Z790 DARK HERO
內存:Crucial DDR5-5600 16GBx2
显卡:NVIDIA RTX™ 5000 Ada Generation
系统碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散热器:ROG ROG RYUJIN III 360
电源供应器:Seasonic VERTEX GX-1000
操作系统:Windows 11 Pro 22H2 64bit、Resizable BAR On
驱动版本:NVIDIA 537.99
GPU-Z检视RTX 5000信息,采用5nm制程的AD102 GPU,有着12800个渲染CUDA核心,以及32768 MB
GDDR6(Hynix)內存,而GPU预设时脉1155 MHz、Boost 2550 MHz。
CINEBENCH 2024新版本全面采用Cinema
4D预设的Redshift渲染引擎开发,并包含GPU、CPU的完整测试并支持跨平台的性能比较,这也带给CPU更强悍的渲染测试。
RTX 5000 GPU获得20137 pts的成绩,比起主流处理器i9-14900K要快上许多。
DaVinci Resolve
18纯粹通过GPU加速的影片剪辑程序,更包含强大的色彩校正与特效功能,并且直接使用CUDA核心运算,让影片剪辑的回放与输出都有着相当好的性能。
首先第一段测试的项目使用4K Blackmagic
RAW图像,有着Wedding_Heavy_Styles时间轴,这段视频使用非常多的Resolve效果,像是OFX: Light Rays / Glow /
Sketch等,输出相当高风格的影片类型。
Bride_FaceRefine_Selective_Color则使用Face Refinement做人脸的追踪,并将主体新娘使用颜色标示;50%
Retime与Optical Flow Enhanced Better都使用Optical Flow技术降低图像50%速度。
SuperScale2x 4K Source使用4K ProRES来源视频制作2x Zoom In主体的4K视频输出;SuperScale4x
HD_Source则是使用HD H.264来源视频,利用Resolve Super Scale输出成4K视频。
RTX
5000具备2组第八代NVENC编码引擎,对于4K影音输出工作有着相当快的处理能力,即便4个HD拼成4K输出也只需1分1秒即可完成任务,其余输出则都在1分钟之内就完成。
第二段测试为双NVENC编码的AV1与HEVC编码测试,测试项目是一段44秒的小短片,来至于Blender Open Movie
Project《Tears of Steel》,并有着8k Prores442HQ 30FPS与4K Prores422HQ
30FPS的视频,可用来测试输出为HEVC、AV1编码的性能。
输出设定主要是使用NVIDIA Encoder、Quality: Restrict to 80000 Kb/s、Encoding Profile:
Main、Rate Control: Constant Bitrate、Preset: Faster、Tuning: High Quality、Two
Pass: Disable等输出设定。
对于RTX 5000来说输出4K项目确实相当轻松,而若升级到8K视频输出,不论HEVC或AV1编码都能有相当快的输出性能。
Blender是跨平台、开放源码的3D创作工具,支持着各种3D作业:Modeling、Rigging、Animation、Simulation、Rendering、Compositing与Motion
Tracking等。而测试,则以Blender Benchmark 3.5.0进行Demo项目的渲染工作测试。
Blender Benchmark测试RTX
5000在monster场景达到3146.377分、junkshop场景1386.968分、classroom场景1515.451分,满足3D创作所需的渲染性能。
V-Ray Benchmark是由Chaos
Group所开发,V-Ray是基于物理法则所设计的光线渲染软件,而此工具可分别针对CPU与GPU进行光线追踪的渲染图象的运算测试。
V-Ray测试,RTX 5000采用CUDA运算可达到每秒2002 vpath的计算量,而采用RTX运算则可达到每秒2474
vray的运算性能。
OctaneBench是快速且独立的渲染测试工具,其核心为OTOY Octane
Render,可充分利用RTX与CUDA技术,并支持主流的3D应用程序,让创作者能有着快速高品质的渲染输出。
测试中包含4种场景与Info channels、direct lighting、path tracing等核心,RTX
5000能提供相当可观的运算速度,满足创作者所需的快速渲染能力。
SPECviewperf 2020基于专业应用所开发的标准绘图性能测试工具,测试各式专业的计算机图形软件如:3ds
Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks等绘图测试与工程模拟。
测试为3840 x 2160分辨率、成績为FPS,可见RTX
5000在各项工作中都能有着相当高的FPS表现,让专业工作者在创作、模拟、运算时也有足够的绘图性能。
Omniverse Creator测试
NVIDIA Omniverse加速3D设计的协作平台,不仅能无缝支持业界主流的3D
apps,让来自世界各地的创作者能同时创作3D项目,并得到即时的渲染效果呈现,更具备Digital Twin、机器人训练模拟等功能。
此次测试主要以Omniverse Create的项目来进行即时光追渲染、DLSS
3加速的FPS性能测试。测试的项目则包含:Campfire_Main_03_Flow3模拟营火燃烧的物理效果、Flowers4测试Instanced
geometry and particle flow
animation、Incense_Main测试烟雾模拟与反射材料变化、JadeTiger测试场景包含玉的高级材料的细致模型、Warehouse_Physics_Stage测试场景则是模拟仓库货架倒塌的骨牌效应。
RTX 5000在UHD ViewPort与DLSS3 Performance设定下,Campfire平均42.49
FPS、Flowers4平均33.19 FPS、Incense_Main平均45.63 FPS、JadeTiger平均45.69
FPS、Warehouse_Physics_Stage平均37.95 FPS的性能表现。
AI算图Stable Diffusion测试
红透半边天的AI深度学习文字到图象的生成模型Stable
Diffusion,经过手动安装采用标准Automatic1111发行的版本,以及扩充导入的TensorRT优化让Stable
Diffusion能够获得最佳的GPU加速性能。
测试的设定与咒语可参考图片下方说明,通过测试RTX 5000
TensorRT可达到每分钟18.46张的图片生成速度,相比标准Automatic1111的仅每分钟5.77张图片,性能足足提升220%。
功耗与温度测量
显卡的功耗与温度测试,使用Omniverse与DaVinci Resolve
18测试的项目运行3次后记录GPU温度与功耗,而最高功耗则藉由Furmark来进行烧机测试。功耗测量时使用NVIDIA提供的PACT工具,可监控PCIe插槽与电源12V提供的瓦数。
显卡温度方面,RTX 5000最高温度压在78.5°C,Omniverse 3D渲染则在75.9°C、DaVinci Resolve
18的8K影音输出则更低仅63°C的温度表现;软件显示GPU预设温度上限为84°C。
显卡TBP功耗测试,在Furmark压力测试达到最高250W的平均功耗,而Omniverse 3D渲染则维持在237.5W、DaVinci
Resolve 18的8K影音输出仅131.9W的功耗表现。
总结
RTX 5000专业绘图卡,采用相同AD102核心、100组SM与32GB GDDR6 ECC內存、GPU
250W功耗等配置下,一样能满足DaVinci Resolve 18的8K AV1影音输出、Omniverse
Creator的即时光追UHD模拟渲染、生成式AI的Stable Diffusion文字推论图片,都能有着相当出色的性能表现。
RTX 5000在价位与显卡功耗上都比旗舰的RTX
6000还要平易近人,这就看项目所需的VRAM与多卡搭配等组合下来挑选合适的专业绘图卡;而且专业绘图卡采用26.7cm长、2-Slot、鼓风扇的工作站设计,在算上只需250W的显卡功耗,让诸多工作站、服务器升级时更佳容易。
NVIDIA给予专业用户完整的软硬体生态系,像是GPU虚拟化、Mosaic、RTX桌面管理,以及由NVIDIA开发的SDK软件工具等整合,横跨AI、数据科学、数据中心、云端、设计、模拟、机器人、高效能运算、自驾车等不同领域,让各行各业的难题都可通过GPU加速迎刃而解。