周观点:2026年,多模态模型有望迎来DS时刻
周观点:2026年,多模态模型有望迎来DS时刻
——行业周报
liuxiaoyao@kysec.cn
证书编号:S0790520090001
市场回顾:本周(2026.2.2-2026.2.6),沪深300指数下跌1.33%,计算机指
数下跌3.27%。
周观点:2026年,多模态模型有望迎来DS时刻
(1)2026年,多模态模型有望迎来DS时刻
OpenAI于2024年2月推出的初代Sora模型,堪称视频领域的GPT‑1时刻,
2025年9月底,OpenAI推出Sora2,视频领域迎来GPT3.5式突破时刻。10月
16日,谷歌在GeminiAPI中发布了Veo3.1和Veo3.1Fast付费预览版,在Veo
3基础上进行了重大升级,带来更丰富的音频支持、更强的叙事控制及更逼真
的质感还原。2026年初,可灵3.0系列模型和字节Seedance2.0相继正式上
线。我们认为2026年多模态模型有望迎来DS时刻,在能力提升的同时,实现
成本端大幅下降,从而推动影视、游戏、广告等内容创意领域的繁荣。
(2)可灵3.0系列和字节Seedance2.0相继上线,开启多模态领域的竞争
2月5日,可灵AI正式全球上线3.0系列模型,可灵3.0系列基于All-in-One产
品和技术理念构建,形成一个多模态输入与输出高度统一的一体化视频模型体
系。此次发布的可灵视频3.0、可灵视频3.0Omni及可灵图片3.0、可灵图片
3.0Omni模型,覆盖图片生成、视频生成、编辑及后期等影视级全流程链路,
标志着AI正式进入影视与创意内容的核心生产环节。2月7日,Seedance2.0
正式上线,其特征为:能生成真正的1080p分辨率视频,提供符合专业标准的
广播级输出;音视频同步,生成视频内容的同时生成同步的音频;多镜头叙事
能力;SeedanceV2运动合成”的技术,可产生流畅、逼真的运动;卓越的提示
词遵循能力,能够准确解释和执行复杂的指令。可灵3.0系列和字节Seedance
2.0相继上线,多模态领域迎来突破性进展。
(3)可灵3.0系列和字节Seedance2.0相继上线,开启多模态领域的竞争
随着多模态模型能力的提升,模型商业化潜力也将进一步释放。可灵AI是国内
商业化最快的多模态模型之一,截至2025年12月,可灵AI已拥有超6000万
创作者,生成视频超6亿个,服务企业用户超3万,年化收入运行率达2.4亿
美元。我们认为2026年将是多模态厂商降本提质,实现商业化的关键一年。
投资建议
我们认为2026年多模态模型有望迎来DS时刻,推动影视、游戏、广告等内容
创意领域的繁荣。受益标的包括万兴科技、海天瑞声、虹软科技、当虹科技、
快手-W、美图公司等。此外,继续关注AI应用端投资机会,推荐金山办公、
合合信息、鼎捷数智、迈富时、致远互联、金蝶国际、博彦科技、用友网络、
同花顺、恒生电子、拓尔思、科大讯飞、焦点科技、中科创达、税友股份、上
海钢联等,受益标的包括泛微网络、福昕软件、汉得信息、万兴科技、第四范
式、多点数智、北森控股、新开普、新致软件、欧玛软件、汉邦高科、石基信
息、汉王科技、汉仪股份、三六零、彩讯股份、金桥信息、佳讯飞鸿等。
风险提示:宏观经济环境下行风险;政策落地不及预期等。
-24%