评论:
Genie是一个从仅视频数据中训练的生成交互式环境。Genie可将看不见的图
像作为提示,从而有创建完全想象的虚拟世界,并与用户交互,用户可以在
Genie生成的环境中进行逐帧行动,Genie开拓了具有创造力的表达新方式。
此外,谷歌提出Genie学到的潜在动作可以转移到真实的人类设计的环境中,
此外,谷歌提出Genie学到的潜在动作可以转移到真实的人类设计的环境中,
应用于多个领域,且不需要任何额外领域知识。
Genie基于内存高效架构,训练过程无动作标签数据。Genie在模型组件中采
用内存高效ST-transformer架构,用以平衡内存和计算约束。用户可以在Genie
生成的环境中进行逐帧行动,该功能主要由三个关键组件决定,潜在行动模型、
视频tokenizer及自回归动态模型。
Genie性能优良,应用场景广泛。Genie具有良好的稳健性,大规模数据训练
效果优良。此外Google仅使用OOD来定性评估Genie模型。定性实验结果表
明,Genie可以生成跨不同领域的高保真、可控视频。Genie突破限制,模拟可
变形物体,未来Genie可以被用于训练多任务智能体的基础世界模型。
投资建议:Genie作为一种通用方法,性能优良,未来应用场景广泛,有望带
动游戏等创新型行业发展,涉及算力、大模型以及AI+应用(绘图、视频)等
领域。建议关注:1)算力基础:海光信息、寒武纪、龙芯中科;2)服务器:
中科曙光、浪潮信息、紫光股份、高新发展、神州数码、拓维信息等;3)大
模型:科大讯飞、商汤、三六零等;4)AI+应用:金山办公、万兴科技、美图、
虹软科技、当虹科技。
风险提示:多模态技术发展不及预期、算力基础设施建设不及预期、AI应用
需求不及预期。
行业基本数据
占比%