【行业研究报告】信息技术-通信行业点评报告:GPT-5发布,多领域取得SOTA,可靠性大幅提升

类型: 行业事件点评

机构: 开源证券

发表时间: 2025-08-08 00:00:00

更新时间: 2025-08-08 19:14:54

GPT-5发布,多领域取得SOTA,可靠性大幅提升
GPT-5发布,多领域取得SOTA,可靠性大幅提升
——行业点评报告
jiangying@kysec.cn
证书编号:S0790523120003
leixingyu@kysec.cn
证书编号:S0790124040002
GPT-5发布,模型能力多方位提升,可靠性大幅加强
2025年8月7日,OpenAI发布GPT-5系列模型,在编码、数学、写作、健康、
视觉感知等方面均实现了显著的提升。GPT5在微软Azure上训练而成,是一个
统一的系统,拥有实时智能“路由器”,用以根据对话类型、复杂度、工具需求
等决定使用智能高效模型来回答大多数问题,或者使用深度推理模型(GPT-5
thinking)来处理更难的问题。在模型幻觉方面,网络搜索场景中,GPT-5相比
GPT-4o发送事实性错误的概率降低45%,在thinking模式下错误概率相比o3降
低约80%;在模型欺骗方面,GPT-5thinking的欺骗率相比o3更低,当任务无
法完成时准确的表达局限性;此外,GPT-5提升指令遵循能力以及降低奉承方面
也取得了提升,总体来看,模型可靠性进一步提升。
GPT-5在多领域取得SOTA,所有用户开放使用
GPT-5在数学、写作、编程、健康等方面能力更强,在数学AIME无工具使用时
得分达94.6%,在现实世界编程SWE-bench验证测试达74.9%,AiderPolyglot
达88%,健康HealthBenchHard测试中达46.2%,均实现新的SOTA。在性能提
升的同时,模型更加高效,GPT-5thinking在包括视觉推理、代理编程和研究生
水平科学问题解决等能力方面,输出tokens数量较o3减少50-80%。在多模态
方面,GPT-5在视觉、视频、空间和科学推理等基准测试中表现出色,thinking
模式下多模态理解MMMU测试中得分达84.2%,解读图像更加准确;在智能体
方面,GPT-5能串联多个操作步骤来完成现实世界任务,在指令遵循和工具调用
基准测试创下新纪录。
价格方面,GPT-5、GPT-5mini、GPT-5nano在输入和输出价格分别为1.25和
10.00美元/百万tokens、0.25和2美元/百万tokens、0.05和0.40美元/百万tokens。
免费用户使用GPT-5达到用量限制后,转为GPT-5mini模型;Plus用户拥有更
多额度;Pro用户可无限使用GPT-5,并可使用GPT-5Pro。
看好海外AI算力产业链或步入估值提升阶段
我们认为AI巨头或进入AI算力和AI应用大规模投入期,海外巨头资本开支加
速释放,AIAgent逐步完善,需高度重视AIDC算力产业链核心投资方向,重视
各大细分板块投资机会:【光模块】推荐标的:中际旭创、新易盛,受益标的:
东山精密、长芯博创等;【液冷】推荐标的:英维克;【光芯片】受益标的:源杰
科技、长光华芯、华工科技、光迅科技等;【MPO&FAU&插芯等】推荐标的:
天孚通信,受益标的:仕佳光子、太辰光、致尚科技等;【光纤】推荐标的:中
天科技、亨通光电;受益标的:长飞光纤、光库科技等;【AIDC】推荐标的:新
意网集团;受益标的:万国数据等;【DCI】受益标的:德科立等;【电源】受益
标的:麦格米特等。
风险提示:算力芯片放量不及预期、AI发展不及预期、行业竞争加剧等。
-12%