其他分享
首页 > 其他分享> > Tesla T4 与 RTX3090Ti 性能对比;深度学习方向效率对比;

Tesla T4 与 RTX3090Ti 性能对比;深度学习方向效率对比;

作者:互联网

部分数值由于厂家不同,略有出入
  Nvidia Tesla T4 Nvidia RTX 3090Ti 该参数的作用
架构   Turing架构 Ampere架构   
VERSUS网评分 52分 94分 综合评分  
Tensor核心数 320个Tensor Core 656个Tensor Core 张量核支持混合精度计算,动态调整计算以加快吞吐量,同时保持精度。
CUDA数量 2560 10725 CUDA运算速度只和核心频率有关,而CUDA核心数量则决定了显卡的计算力的强弱。(比如,一项渲染任务,可以拆分为更多份交给不同的CUDA核心进行处理)
       
单精度浮点性能(FP32) 8.1FLOPS    
半精度浮点数(FP16) 65TFLOPS    
INT4浮点性能 260TFLOPS    
浮点性能 7.76 TFLOPS 40 TFLOPS 浮点运算性能是衡量GPU处理器基本马力的方法
AI计算运行速度    320TFLOPS  
显存带宽(存储器带宽) 320 GB/s 1008 GB/s  
显存类型 GDDR6 GDDR6X  
显存大小(VRAM) 16G 24G 是显卡的专用内存。更多的VRAM通常在解析纹理方面的性能更强。
内存总线宽度(显存位宽) 256bit 384bit 更宽的总线宽度代表在每个电脑运行周期能处理更多的数据。(代表GPU芯片每个时钟周期内能从GPU显卡中读取的数据大小,值越大,代表GPU芯片与显存之间的数据交换的速度越快。)
       
GPU时脉速度 1005MHz 1670MHz  
核心频率 1582Mhz 1560MHz  
超频频率(GPU TURBO) 1590MHz 1890MHz   当cpu运行低于其限制速度时,其会促进更高的时钟速度,从而获得更高的性能。
纹理速率      
像素率      
功率 75w   450w  

标签:显存,Tensor,Tesla,T4,性能,CUDA,显卡,GPU,对比
来源: https://www.cnblogs.com/cainiaoxuexi2017-ZYA/p/16426609.html