图表内容
图表16:云瑞A/加速器比较表
A100 GPU
D1 ASIC
Ponte Vecchio
MI200
供应商
英伟达
Tesla
Intel
超威
应用
云端推理训练
云端推理训练
云端推理训练
云端推理训练
CPU/GPU连结标准
Nvlink 500GB/s
PCIE Gen 6.0/CXL 128GB/s
Infinity Fabric 3.0
400GB/s
TSMC540亿晶体管
1000亿品体管,47芯片,tsmc5nm
制程工艺
500亿品体管,7nm
2 x CDNA2架构,
7nm CoWoS
x16
8核心=128核心(compute
826mm2
645mm2
TSMC 6nm
tile)
intel 7nm x2 640mm2 (base
tile)
tsmc 7nm x2 (link)
2x290=580亿晶体管,
浮点FP16半精度Matrix
312 TFLOPS
362 TFLOPS
383 TFLOPS
浮点FP32单精度Vector
19.5 TFLOPS
22.6 TFLOPS
45 TFLOPS
47.9 TFLOPS
浮点FP32单精度Matrix
N/A
95.7 TFLOPS
浮点FP64双精度Vector
9.7 TFLOPS
47.9 TFLOPS
浮点FP64双精度Matrix
19.5 TFLOPS
95.7 TFLOPS
最大耗电量
400W
400W
560W
来源:各公司官网,国金证券研究所