3.22%,在31个申万一级行业中排名第6位。截至本周五(7月11日),
计算机行业指数与较年初上涨9.75%,跑赢沪深300指数7.72pct。
7月10日,xAI发布新一代大模型Grok4系列。Grok4系列包括
Grok4和Grok4Heavy两个版本,Grok4为单智能体模型,Grok4
Heavy为多智能体的升级版,可支持4个agent同时工作。Grok4系列推
理能力大幅提升,在多个基准测试中刷新行业SOTA。
理能力大幅提升,在多个基准测试中刷新行业SOTA。
Grok4系列在各项专业学科基准测试中表现大幅领先,在知识能力
上已经超越研究生水平。在HLE(HumanitiesLastExam,由各学科专家
编写的高难度学术测试集)测试中,在使用工具的情况下,Grok4的成
绩为38.6%,Grok4Heavy的成绩为44.4%,大幅超越o3和Gemini2.5
Pro。如果在推理阶段增加算力投入并使用工具,则分数进一步提升至
50.7%。在AIME25、GPQA、HMMT25等其他权威基准测试方面,Grok4Heavy
均超越其他此前最先进的模型夺冠。
Grok展现出较强的解决复杂现实任务的能力。在衡量复杂任务解决
能力的商业环境测试Vending-Bench中,Grok-4模拟经营取得的利润是
第二名ClaudeOpus4的两倍。在游戏领域,Grok-4可以设计和构建视
频游戏,包括资源获取、写代码等,研究人员用4个小时制作出一款第一
人称射击游戏。此外,Grok4在生物医药、金融等领域也取得较大突破。
Grok4性能的大幅提升主要来源于算力投入的大幅增长,以及在训
练阶段引入工具使用。Grok-4在xAI建设的20万卡集群Colossus上运
行强化学习训练,其训练量是Grok-2的100倍、Grok-3的10倍。Grok
4Heavy通过提高强化学习阶段的算力投入以提升模型效果。Grok4特
别强调了在后训练过程中原生融入工具,比如在“人类最后考试HLE”上,
在后训练中融入工具,不仅比不使用工具能取得更高分数,而且Scaling
提升效率也更高。即增加同样的计算资源,工具融入训练能带来更高智能。
投资建议:xAI新发布的模型进一步加强了基座模型能力,有望加速
AI应用落地。重点推荐金山办公、用友网络、赛意信息、熵基科技、云从
科技等,AI应用的发展也会促进基础设施的发展,重点推荐海光信息、
智微智能、联想集团等。
风险提示:AI技术发展不及预期,市场竞争加剧。
(10%)
10%
30%
50%
70%
90%