【行业研究报告】互联网-计算机行业动态跟踪:视频生成进入精准控制时代,创作平权带动B/C两端加速渗透

类型: 行业动态分析

机构: 东方证券

发表时间: 2026-02-08 00:00:00

更新时间: 2026-02-09 09:11:57

⚫视频生成赛道迭代提速,推动行业技术跃升,海内外技术差距持续收窄。今年整体
看,国内视频生成厂商进一步加速模型研发节奏,如快手可灵【2.0版本(25年4
月)→2.5版本(25年9月)→2.6版本(25年12月)→3.0版本(26年2月)】、即梦
月)→2.5版本(25年9月)→2.6版本(25年12月)→3.0版本(26年2月)】、即梦
Seedance【1.0版本(25年6月)→1.5版本(25年12月)→2.0版本(26年2月)】。
随着各家最新模型发布,国内供给侧的技术天花板进一步提升,物理规律合理性、
运动流畅性、指令遵循能力等基础属性均显著增强,分镜能力、音画同出(海外前
沿模型率先突破)功能缺位补齐且效果更好更可控;与海外差异化在于支持图片、
音频、视频等多模态输入的参考生成,和视频二次编辑能力。总体来看,视频生成
赛道进入类25年LLM模型的竞争状态,各家在基础能力均达到较高水准的前提
下,我们判断后续各家差异化或在于具体落地场景。
⚫视频生成进入精准可控“仪表盘时代”,门槛降低带动B/C双端用户扩容。总结近
期视频生成的边际演进:(1)从随机生成到精准可控,近期迭代的最新模型,如
ViduQ3/可灵3.0/Seendance2.0,基本都是支持多模态输入的架构,即可上传图
片、视频、音频进行参考生成,相较去年的随机生成,可控性更强,因此抽卡成品
率也显著提升;(2)时长更友好(单次生成增至15秒左右),B/C端用户的创作
门槛也进一步降低,国产模型基本补齐多镜头叙事功能,因此对于泛C端小白用户
只要具备好想法,就能借助工具帮助创作;对于B端创作者来说,模型自主设计每
个分镜头,也降低了对于创作者的分镜功底要求。(3)可编辑性,支持对生成内容
进行精细化的增、删、改操作,快速完成二次调整。我们认为,26年模型的技术迭
代更往生产流程落地,帮助创作者高效表达意图、实现可控创作。
我们认为应重视垂类多模态AI应用机会,看好技术突破、成本优化带来产业趋势加速发