首页 > 其他分享> > Tesla T4 与 RTX3090Ti 性能对比；深度学习方向效率对比；

Tesla T4 与 RTX3090Ti 性能对比；深度学习方向效率对比；

2022-06-30 14:04:42 作者：互联网

部分数值由于厂家不同，略有出入
	Nvidia Tesla T4	Nvidia RTX 3090Ti	该参数的作用
架构	Turing架构	Ampere架构
VERSUS网评分	52分	94分	综合评分
Tensor核心数	320个Tensor Core	656个Tensor Core	张量核支持混合精度计算，动态调整计算以加快吞吐量，同时保持精度。
CUDA数量	2560	10725	CUDA运算速度只和核心频率有关，而CUDA核心数量则决定了显卡的计算力的强弱。（比如，一项渲染任务，可以拆分为更多份交给不同的CUDA核心进行处理）

单精度浮点性能(FP32）	8.1FLOPS
半精度浮点数(FP16)	65TFLOPS
INT4浮点性能	260TFLOPS
浮点性能	7.76 TFLOPS	40 TFLOPS	浮点运算性能是衡量GPU处理器基本马力的方法
AI计算运行速度		320TFLOPS
显存带宽（存储器带宽）	320 GB/s	1008 GB/s
显存类型	GDDR6	GDDR6X
显存大小（VRAM）	16G	24G	是显卡的专用内存。更多的VRAM通常在解析纹理方面的性能更强。
内存总线宽度（显存位宽）	256bit	384bit	更宽的总线宽度代表在每个电脑运行周期能处理更多的数据。（代表GPU芯片每个时钟周期内能从GPU显卡中读取的数据大小，值越大，代表GPU芯片与显存之间的数据交换的速度越快。）

GPU时脉速度	1005MHz	1670MHz
核心频率	1582Mhz	1560MHz
超频频率（GPU TURBO）	1590MHz	1890MHz	当cpu运行低于其限制速度时，其会促进更高的时钟速度，从而获得更高的性能。
纹理速率
像素率
功率	75w	450w

标签：显存,Tensor,Tesla,T4,性能,CUDA,显卡,GPU,对比
来源： https://www.cnblogs.com/cainiaoxuexi2017-ZYA/p/16426609.html