Hopper架构通过追加一层layer处理transformer算法-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

Hopper架构通过追加一层layer处理transformer算法

研究报告节选:

以英伟达为代表的 AI 芯片巨头,在新一代芯片中针对产业中常用的 AI 模型,特别设计了新引擎以大幅提升计算能力。英伟达的 Hopper 架构引入了 Transformer 引擎,大幅加速了 AI 训练。Transformer 引擎采用软件和自定义 NVIDIA Hopper Tensor Core 技术,该技术旨在加速训练基于常见 AI 模型构建模块(即 Transformer)构建的模型。这些 Tensor Core 能够应用 FP8 和 FP16 混合精度,以大幅加速 Transformer 模型的 AI 计算。采用 FP8 的 Tensor Core 运算在吞吐量方面是 16 位运算的两倍。Transformer 引擎利用定制的、经 NVIDIA 调优的启发式算法来解决上述挑战,该算法可在 FP8 与 FP16 计算之间动态选择,并自动处理每层中这些精度之间的重新投射和缩放。根据英伟达提供的数据,Hopper 架构在训练 Transformer 模型时,效率可以达到安培模型的 9 倍。
最后更新: 2022-06-23

相关行业研究图表


TOP.5准确率变化
TOP.5准确率变化-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
Amazon Go无人零售
Amazon Go无人零售-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
阿里云人工智能平台
阿里云人工智能平台-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
2020财年Nuance医疗业务营收结构(百万美元)
2020财年Nuance医疗业务营收结构(百万美元)-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
AWS底层算力升级使得上层负载运行效率、性价比持续提升(min)
AWS底层算力升级使得上层负载运行效率、性价比持续提升(min)-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
主要科技巨头算法平台框架
主要科技巨头算法平台框架-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

图表内容


7:Hopper架构通过追加一层layer处理transformer算法
Transformer layer
Next layer information
Transformer Engine
Range
Adaptive
Analysis
Target format
Format
Scaling factors
Conversion
H100 Tensor Core
Adaptive precision
High precision
-Auxiliary data