【行业研究报告】信息技术-计算机行业周报:AMD公布MI325X同台竞技英伟达,“年更”预示AI芯片竞争趋于白热化

类型: 行业周报

机构: 华鑫证券

发表时间: 2024-06-16 00:00:00

更新时间: 2024-06-16 19:14:26

▌算力:算力租赁价格平稳,AMDInstinct产品线
更新MI325X同步英伟达
本周算力租赁价格环比持平。在产业动态方面,近期,AMD董事长兼
本周算力租赁价格环比持平。在产业动态方面,近期,AMD董事长兼
CEO苏姿丰在Computex2024展会的开幕主题演讲中公布了今年将会推
出InstinctMI325X,2025年推出MI350,2026年推出MI400。MI325X
将具有更大的算力规模,并转向第四代高带宽内存HBM3E。容量大幅提
升至288GB,内存带宽提升至6TB/s。与英伟达相比,MI325X内存大小
和单服务器可运行模型参数规模是英伟达H200的2倍。内存带宽、理
论FP16算力峰值、理论FP8峰值则是英伟达H200的1.3倍,可谓是
AMD史上最大的AI性能提升。同时,MI350的内存容量将是英伟达
2025年推出的B200芯片的1.5倍,AI算力是B200芯片的1.2倍。
AMD预计将在2026年推出基于CDNA"Next"架构的InstinctMI400加
速器系列,一年一更同步英伟达。
▌AI应用:苹果发布AppleInteligence智能系
统,正式开启端侧AI新时代
当地时间6月10日,苹果发布了AppleIntelligence,一款深度集成
于iOS18,iPadOS18和macOSSequoia的全新个性化智能系统。
AppleIntelligence由多种智能生成模型组成,端侧云端混合并行,
专为用户日常任务设计。端侧上,AppleIntelligence拥有约30亿参
数的语言模型。在设备端和私有云上,苹果对模型生成的第一个token
和后续token的推理过程进行了优化,采用分组查询注意力机制、共享
的输入和输出词汇嵌入表。设备端模型词汇量为49000,服务器模型为
100000,在iPhone15Pro上,从接收到提示词到生成第一个token
所需时间约为0.6毫秒,生成速率为每秒30个token。在Apple
Intelligence的加持下,Siri的智能化水平进一步提升,具备更丰富
的语言理解能力和用户交互体验。
▌AI融资动向:MistralAI获6.4亿美元B轮融资
本期AI初创公司的融资中,MistralAI/Cognigy融资额前二,分别
为6.4亿/1.0亿美元。MistralAI是欧洲最强的LLM大模型公司,
-50
-40