云瑞A/加速器比较表-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

云瑞A/加速器比较表

研究报告节选:

◼ AMD 强势推出 MI200 AI GPU:AMD 于 11 月 10 日推出用台积电 6nm 制程工艺制造的 MI200 AI 加速 GPU, 两颗 CDNA2 芯片架构共计 2x290, 580亿晶体管, 再整合上自己设计的 x86 CPU,但透过 AMD 独家设计的 Infinity Fabric 2.0 连结技术,超威也可以让 CPU/GPU 共同分享存储器达到 Cache Coherency。最后,AMD 要是能够率先达成 cache coherency, 利用 Infinity Fabric 来连结 5nm CPU Genoa 及 AI GPU 加速器 MI200,公司的主轴将从 2020-2021-2022 年抢 Intel 笔电,服务器 CPU 份额,转到2023 年抢 Nvidia 游戏显示卡及 AI 加速器 GPU 在重型工业、政府 AI 推理运算的份额。而在 ASIC 方面,有寒武纪最新推出的 TSMC 7nm 思元 370 S4/X4 云端推理加速卡,对标英伟达 12nm 的 75W T4 及 150W A10 GPU 加速卡, 还有之前的思元 290 云端训练芯片及加速卡及云端训练整机玄思1000,都是定位在 AI 智能服务器芯片市场。 所以全球 AI 服务器(使用GPU, ASIC 来做人工智能定点,浮点训练及推理运算)出货占比的提升,对 AI 服务器芯片及 HBM 内存需求同比增长有明显的拉动作用, 占比逐年提升可期,我们保守假设到 2030 年全球有超过 30%服务器具备 AI GPU/ASIC 的人工智能运算功能。
最后更新: 2022-03-01

相关行业研究图表


2020年全球光模块市场份额
2020年全球光模块市场份额-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
Horizon Worlds
Horizon Worlds-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
计算服务器、加速计算服务器。
计算服务器、加速计算服务器。-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
数通光模块市场规模(亿美元)
数通光模块市场规模(亿美元)-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
VR头显光学透镜分类
VR头显光学透镜分类-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
VR与AR存在差异与共性
VR与AR存在差异与共性-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

相关行业研究报告


图表内容


图表16:云瑞A/加速器比较表
A100 GPU
D1 ASIC
Ponte Vecchio
MI200
供应商
英伟达
Tesla
Intel
超威
应用
云端推理训练
云端推理训练
云端推理训练
云端推理训练
CPU/GPU连结标准
Nvlink 500GB/s
PCIE Gen 6.0/CXL 128GB/s
Infinity Fabric 3.0

400GB/s
TSMC540亿晶体管
1000亿品体管,47芯片,tsmc5nm
制程工艺
500亿品体管,7nm

2 x CDNA2架构,
7nm CoWoS

x16
8核心=128核心(compute
826mm2
645mm2
TSMC 6nm

tile)
intel 7nm x2 640mm2 (base
tile)
tsmc 7nm x2 (link)
2x290=580亿晶体管,
浮点FP16半精度Matrix
312 TFLOPS
362 TFLOPS
383 TFLOPS
浮点FP32单精度Vector
19.5 TFLOPS
22.6 TFLOPS
45 TFLOPS
47.9 TFLOPS
浮点FP32单精度Matrix
N/A
95.7 TFLOPS
浮点FP64双精度Vector
9.7 TFLOPS
47.9 TFLOPS
浮点FP64双精度Matrix
19.5 TFLOPS
95.7 TFLOPS
最大耗电量
400W
400W
560W
来源:各公司官网,国金证券研究所