DIY大佬借20系到40系的主流显卡让它们华山论剑

深海蓝天网络提醒您：深海蓝天_www.xkf888.com_官方商务合作唯一QQ：105808800

近来的Ai圈可以说是太火了，前段时间我们编辑部去出席了中国电子博览会，其中绝大部份的展商都是来自高性能服务器的品牌。

在探展的过程中，深感现今的Ai算力市场的空前热度，随着GPT的爆火，每位企业、组织、个人都听到了借助Ai来提高生产效率的可能，这其中，以Ai书法为代表正在快速肆虐着设计、绘画、动漫行业，个人用户也可以通过等引擎来训练自己的Ai人物形象或则设计物品。而依赖的正是本地主板算力，所以假如想要拥有快速、精准的Ai图象生成，一张算力强劲的主板是必不可少的。

近来，发布，早就听闻RTX40系在Ai算力上的提高，所以问DIY大鳄借了20系到40系的主流主板，来让它们华山论剑，瞧瞧谁在Ai油画上的能力更强。

Ai作品

首先介绍一下出征的选手们，老当益壮组的20系主板：、、。正值壮年的30系主板：、12GB、、、、、、。青春无限的40系主板：、、、。

赛前首先是选手们的身分信息大公布：

对于本次的Ai书法能力交锋，区别选手们的主要点是主板的构架、CUDA核心数目、显存与核心。其中核心是部份主板中专门用于加速深度学习任务的处理单元。核心针对深度学习中的矩阵运算进行了优化电脑怎么查显卡大小，就能明显提升神经网路模型的训练和推理速率。在后续的对比中，我们也能看出核心的代数与核心数与成绩的关系。

第一代核心首次出现在Volta构架显存中，针对混和精度矩阵加法进行优化。第二代核心引入构架主板，降低了对INT8和INT4整数精度的支持，并引入了RT核心用于实时光线追踪估算。第三代核心出现在构架主板，增强了FP16混和精度矩阵加法的FLOPs，并支持稀疏性估算。

而第四代核心随着RTX40系的发布而更新，在全新的Ada构架中，通过引入DLSS技术和Flow等新技术，为Ai提供了明显的性能提高。并通过Cores加速器（专门用于深度学习任务的硬件加速器）急剧增强深度学习模型训练和推理性能，但是支持FP16、BF16和TF32精度。

据悉，AdaGPU构架还支持CUDA-XAI软件库，这是一套用于加速AI应用的软件工具包。CUDA-XAI包括、cuDNN、等组件，可以提升深度学习推理性能和训练速率。

好的，简单介绍完参战选手们的基本信息，就来到本次大赛的第一关，基础性能参数对比，将由“GPGPU”考官出题，考察选手们的综合实力。想看Ai美眉的听众先别急，先放出一张美眉垫食欲。

Ai书法；来自主板，1024*1024码率，单张历时：1.14分钟

第一道题是-，这个测试项目评估主板在单精度浮点数运算（32位浮点数）上的性能，单精度浮点数一般用于表示小数，以为单位，其表示每秒千亿次浮点运算。

第二道题是-，评估主板处理另一种称为"双精度浮点数"的数据时的估算能力。双精度浮点数比单精度浮点数更精确，常用于科学估算等要求高精度的场景。以为单位，其表示每秒千亿次浮点运算。

第三道题是24-Bit，这个测试项目评估主板在24位整数运算上的性能。整数是没有小数部份的数字，如1、2、3等。以为单位，其表示每秒千亿次浮点运算。IOPS表示每秒整数运算次数，GIOPS表示每秒千亿次整数运算（GigaIOPS），以GIOPS为单位。

第四道题和第五道题分别是32-Bit、64-Bit，聪明的男子伴都晓得这是跟前面24-Bit是一组组合题，考察主板32位整数运算、64位整数运算能力。

第六题是AES-256估算能力，评估主板处理一种名为AES-256的加密任务时的性能。加密是为了保护数据安全而对数据进行编码的过程。

第七题是SHA-1Hash编码能力，这个可能好多玩家都比较熟悉，这就是挖矿佬喜欢的哈希算力，哈希算法是一种将数据转换成固定宽度的惟一字符串的过程，一般用于校准数据完整性和安全应用，常用于区块链应用中。

第八题是-julia，这个测试项目评估主板在渲染单精度Julia分形图象时的性能。Julia分形是一种复杂物理对象今日刚开一秒传奇，须要大量估算资源进行渲染。测试结果以FPS表示。

最后一题便是-；双精度分形渲染，评估主板渲染一种名为分形的复杂物理图形时的性能。类似于Julia分形渲染，但使用更高精度的数据进行估算。

对于GPGPU的测试，我们可以看出，不仅顶尖的外，剩下主板之间都存在着显著的递进关系，等级肃穆，与售价与定位严格挂钩，再者，数据测试仅能作为Ai制图的一个参考项目，借以对比不同主板之间的数据。

参战选手的首发价钱对比

接出来就步入即将的Ai书法环节，首先是画官方指定的小房屋，瞧瞧疗效。作图的参数是：使用v2-1768-模型；768*768的规格；Steps:50；CFGscale:7.5，共画10组，每组2张。

Ai作品

从测试结果来看，诸位参战选手的Ai书法表现与她们在GPGPU中的各项考试表现类似，柱状图的分布几乎一致，其中高于5张/min的选手有、、，尽管配有12GB的大显存，但在Ai作图所须要的高算力面前还是只能甘拜下风，112核心的第三代没能让它在Ai作图中继续“甜品”下去。

而超过了优秀水平10张/min的选手就比较多了，、、、、，以及两个9张/min的差点成为优秀水平的和，这两位选手的用时几乎一致，但只搭载了184核心的第四代，而则是使用了272核心的第三代，这33%的核心数差别，就是通过技术迭代来填补的。

接下来看一下选手们在画小屋时的内存占用情况，为了便捷大赛公正起见，我们根据内存容量进行了分组：

8GB内存组

12GB内存组

其他内存组

整体表现情况

通过图表与数据情况可知，在画小屋的时侯，面对768*768码率的Ai作图情况，主板的内存普遍占用都在8GB左右，倘若只是搭载了8GB内存的主板，才会有跑满的风险，因而连累运算速率。

接出来就是你们期盼的画Ai小妹妹，在画小妹妹的选择上，我们使用了模型，匹配3个不同的LORA人体素材库，调整了各素材的比重，最终勾画出独一无二的小妹妹，单幅规格为1024*1024，一组5张。

首先来欣赏一下小妹妹的美艳：

Ai书法

具体的以及模型配置如图，喜欢的男子伴可以直接Copy，把小妹妹带回去

因为画小妹妹的模型和配置以及规格较大，对诸位选手也导致了巨大的考验电脑怎么查显卡大小，就连算力最为强劲的，也只保持不到3张每分钟的成绩，可见对于画高清人像来说，游戏主板还是有着较高的压力，来看一下诸位选手们的成绩吧。

面对巨大的算力挑战，诸位参赛选手出现了显著的性能吃紧，不少选手们的书法时间只能保持在一分钟一张左右，而非常出众的旗舰选手们能够见到2张每分钟的门槛。甚至还有的选手（）只能维持2分钟画一张的水平。

在画小屋时旗鼓相当的和总算在这轮拉开了差别，以近20%的实力差别绝杀了，也以10%的优势超过了，撑住了80主板的尊严与声望。

而在内存占用上，小屋大赛时还有能漏网之鱼的8GB内存组，在本轮测试中，无一例外，全部内存跑满，集体出现内存不足的情况。

在12GB内存组选手中，尽管没有跑满内存，并且在RTX40系主板中也出现了内存吃紧的情况，RTX40系两兄弟内存都被Ai吞掉了95%左右。

与同样使用24GB内存的，在Ai作图时就比后者多占用了17%左右的内存空间，让Ai引擎吃到了17GB左右的内存空间，配合一骑绝尘的512核心第四代核心，无疑惑鼎了本次Ai书法算力对比之巅。

整体表现情况

主板Ai绘图最大帧率一览

主板煤耗比情况一览

•总结

主板与AI书法的关系如同是作家的手与笔触之间的紧密配合，在这个关系中，主板是高效处理大量并行估算任务的关键硬件，而AI书法则是依赖主板强悍估算能力实现的一种先进的艺术方式。AI书法技术一般采用生成对抗网路（GANs）或变分自编码器（VAEs）等深度学习模型来世成具有特定风格或特点的图象。

而显存也早已从单纯的图象处理器，逐步演弄成了复杂的估算平台。两者相辅相成，互相推动Ai生成、深度学习、显卡领域的不断发展，成为硬件市场上为数不多一直迸发活力的领域。

Ai算力服务器-Ai书法

在本期的【AI时刻】中，我们对15款主板的AI书法能力进行了深入评测。从测试结果中，我们显著见到主板在AI和深度学习算力上的持续进步。尤其是在RTX40系列主板中，得益于全新的构架和愈加先进的核心技术，致使RTX4070除了能与前代RTX3080在AI算力上一较高下，同时在保持中上游AI性能的情况下，帧率愈发优越。

因而，假如你对AI估算（如画AI小妈妈）感兴趣，并希望拥有一款性能与帧率兼具的主板，这么RTX4070无疑是一个理想的选择。而假如你准备通过游戏主板（因为各类缘由，A100/H100无法订购）来搭建一个大型AI服务器，这么选择多张RTX4090则毫无疑惑是最佳方案。无论是从性能、功耗还是扩充性的角度，RTX40系列主板为游戏玩家、AI领域的开发者提供了更多可能性，展示了主板技术在未来的发展潜力。

END

‍