Tesla T4 与 RTX3090Ti 性能对比;深度学习方向效率对比;
作者:互联网
部分数值由于厂家不同,略有出入 | |||
Nvidia Tesla T4 | Nvidia RTX 3090Ti | 该参数的作用 | |
架构 | Turing架构 | Ampere架构 | |
VERSUS网评分 | 52分 | 94分 | 综合评分 |
Tensor核心数 | 320个Tensor Core | 656个Tensor Core | 张量核支持混合精度计算,动态调整计算以加快吞吐量,同时保持精度。 |
CUDA数量 | 2560 | 10725 | CUDA运算速度只和核心频率有关,而CUDA核心数量则决定了显卡的计算力的强弱。(比如,一项渲染任务,可以拆分为更多份交给不同的CUDA核心进行处理) |
单精度浮点性能(FP32) | 8.1FLOPS | ||
半精度浮点数(FP16) | 65TFLOPS | ||
INT4浮点性能 | 260TFLOPS | ||
浮点性能 | 7.76 TFLOPS | 40 TFLOPS | 浮点运算性能是衡量GPU处理器基本马力的方法 |
AI计算运行速度 | 320TFLOPS | ||
显存带宽(存储器带宽) | 320 GB/s | 1008 GB/s | |
显存类型 | GDDR6 | GDDR6X | |
显存大小(VRAM) | 16G | 24G | 是显卡的专用内存。更多的VRAM通常在解析纹理方面的性能更强。 |
内存总线宽度(显存位宽) | 256bit | 384bit | 更宽的总线宽度代表在每个电脑运行周期能处理更多的数据。(代表GPU芯片每个时钟周期内能从GPU显卡中读取的数据大小,值越大,代表GPU芯片与显存之间的数据交换的速度越快。) |
GPU时脉速度 | 1005MHz | 1670MHz | |
核心频率 | 1582Mhz | 1560MHz | |
超频频率(GPU TURBO) | 1590MHz | 1890MHz | 当cpu运行低于其限制速度时,其会促进更高的时钟速度,从而获得更高的性能。 |
纹理速率 | |||
像素率 | |||
功率 | 75w | 450w |
标签:显存,Tensor,Tesla,T4,性能,CUDA,显卡,GPU,对比 来源: https://www.cnblogs.com/cainiaoxuexi2017-ZYA/p/16426609.html